YandexGPT vs GigaChat — глубокое сравнение
Технический выбор между двумя production-LLM в РФ. 9 осей: API surface, fine-tuning, embeddings, function calling, multimodal, prompt caching, governance, экосистема, цены. Для CTO, AI-архитекторов, lead engineer-ов. 2026-06.
TL;DR
YandexGPT — более зрелая документация + community, лучший speech stack (SpeechKit), более стабильный API; GigaChat — лучше function calling, имеет multimodal (Vision API в production), интегрирован с большой Сбер enterprise-экосистемой. Качество русского — примерно равно; на code generation GigaChat слегка впереди.
1. API surface + SDK
| Аспект | YandexGPT 4 Pro | GigaChat Pro |
| REST API | да, OpenAPI-документация | да, OpenAPI 3.0 spec |
| OpenAI-compatible endpoint | нет (свой API style) | да (с 2025 — drop-in для openai-python) |
| Python SDK | yandex-cloud-ml-sdk | gigachat (PyPI + community) |
| Streaming | SSE через REST | SSE через REST |
| Auth | OAuth Yandex IAM + Service Account API key | OAuth ЕБК + Master Token |
| Rate limits (default) | 10 RPS, 1М tokens/min | 5 RPS, 500K tokens/min |
| SLA на API uptime | 99.95% | 99.9% |
2. Fine-tuning
| Опция | YandexGPT | GigaChat |
| SFT (supervised fine-tuning) | через DataSphere, LoRA-based | через ML Space, LoRA-based |
| Минимальный dataset | ~500 examples | ~1000 examples |
| Длительность fine-tune | 3-12 часов | 4-24 часа |
| Стоимость одного цикла | ~₽30 000-₽80 000 | ~₽40 000-₽100 000 |
| Versioning + rollback | да, через DataSphere | да, через ML Space |
| Перенос fine-tune между вендорами | нет | нет |
| Continual learning / incremental | нет (полный re-tune) | preview (бета) |
3. Embeddings
| Параметр | YandexGPT embeddings | GigaChat embeddings |
| Размерность | 768 | 1024 |
| Максимальная длина входа | 8192 tokens | 4096 tokens |
| Цена за 1М tokens | ~₽100 | ~₽150 |
| Поддерживает batch API | да (до 100 запросов) | да (до 50) |
| Качество на MTEB-RU | ~76 | ~78 |
| Совместимость с vector store | любой 768-dim (Pinecone, PGVector, etc) | любой 1024-dim |
4. Function calling / Tool use
| Capability | YandexGPT | GigaChat |
| Native function calling | да (с YandexGPT 4) | да (с GigaChat Pro 4) |
| Format | JSON Schema-based, похож на OpenAI | OpenAI-совместимый |
| Parallel function calls | нет (одна функция за turn) | да (до 5 параллельно) |
| Forced function call | через "function_call":"auto"|"name" | через "tool_choice":"required"|name |
| Structured output (JSON mode) | через prompt + validators | да, response_format=json_object |
| Reliability JSON-output | ~93% | ~96% |
5. Multimodal
| Modality | YandexGPT | GigaChat |
| Vision (image input) | YandexGPT Vision (preview) | GigaChat Vision (production) |
| Vision quality (Russian VQA) | хорошее | лучшее в РФ-сегменте |
| PDF input | через предварительный OCR | native PDF (с 2025) |
| Audio input (speech-to-LLM) | через SpeechKit pipe | через SaluteSpeech pipe |
| Image generation | Yandex Art (отдельный API) | Kandinsky (отдельный API) |
| Video understanding | нет | нет |
6. Prompt caching + economic optimizations
| Optimization | YandexGPT | GigaChat |
| Prompt caching | нет (manual approach: embed-then-retrieve) | preview (бета, 50% дисконт) |
| Batch API discount | ~10% при batch | ~15% при batch |
| Reserved capacity | через enterprise-договор | через Сбер enterprise terms |
| Token-level streaming для UX | да | да |
| Sleeper / async mode | нет | нет |
7. Governance + Safety
| Aspect | YandexGPT | GigaChat |
| Content moderation built-in | да (Yandex Cloud Content Filter) | да (SberSafety) |
| PII detection в outputs | через дополнительный модуль | встроено в Premium tier |
| Audit logs | через Yandex Cloud Audit Trails | через ЕБК Activity Log |
| Data retention | 30 дней (можно отключить) | 90 дней по умолчанию |
| Training-data opt-out | да (для enterprise) | да (для enterprise) |
| 152-ФЗ compliance | full (все данные в РФ) | full (все данные в РФ) |
8. Ecosystem fit
| Ecosystem | YandexGPT интеграция | GigaChat интеграция |
| Bot frameworks | Yandex Dialogs, Алиса skill | Сбер Salute skill, Telegram bot starter |
| RAG-frameworks (LangChain, LlamaIndex) | через community-провайдеры | официальный langchain-gigachat |
| Vector store integration | Pinecone / PGVector / любой | Pinecone / PGVector / любой |
| Enterprise contract paths | через Yandex Cloud B2B sales | через Сбер enterprise + ЕБК |
| Российский compliance integration | Yandex DocFlow | Сбер enterprise content + EDM |
| Multimodal partner ecosystem | SpeechKit, Yandex Art | SaluteSpeech, Kandinsky, GigaChat Vision |
9. Цены — детальное
| Tier | YandexGPT | GigaChat |
| Free tier (testing) | ~100K tokens/мес | ~1М tokens/мес (более щедрый) |
| Pro tier: input | ₽1 600/М tokens | ₽1 800/М tokens |
| Pro tier: output | ₽3 200/М tokens | ₽3 500/М tokens |
| Lite tier: input/output | ₽600 / ₽1 200 per M | ₽700 / ₽1 400 per M |
| Vision (image) | ~₽0.5 за изображение | ~₽0.7 за изображение |
| Embeddings | ₽100 / М tokens | ₽150 / М tokens |
| Fine-tuned model serving (на токен) | +50% от Pro | +40% от Pro |
Decision rule
- Простой production chat-bot или RAG-система без особых требований — берите YandexGPT 4 Pro. Дешевле, лучше документация, более стабильное API.
- Heavy function calling / tool-use агентский workflow — GigaChat Pro. Parallel function calls + надёжный JSON mode + OpenAI-compatible endpoint облегчают портирование.
- Multimodal (анализ изображений, PDF в production) — GigaChat Vision уже зрелее YandexGPT Vision (preview).
- Бизнес уже в экосистеме Сбера (банк-клиент Сбера, использует Сбер EDM, ЕБК) — GigaChat, меньше contract-friction.
- Бизнес уже использует Yandex Cloud — YandexGPT, единая IAM + биллинг.
- Высокие требования к speech (callcenter, voice assistant) — YandexGPT + SpeechKit. SaluteSpeech неплохой, но SpeechKit зрелее на edge cases.
- Дублирование рисков и evaluation — большие enterprise часто закладывают возможность переключения. Готовьте Adapter layer (LiteLLM подходит) — даёт двух-векторное планирование без коммитмента.
SLAtech помогает выбрать LLM-вендор и спроектировать production-архитектуру вокруг YandexGPT / GigaChat / гибрида: Сравнение российских LLM › · Связаться ›