Российские LLM 2026
YandexGPT vs GigaChat vs Saiga vs T-lite vs OpenAI через периметр. Структурированный выбор LLM для бизнеса в РФ с учётом санкций, 152-ФЗ, качества русского языка и vendor lock-in. По состоянию на 2026-06.
TL;DR
YandexGPT 4 Pro — лучшее качество на типовых деловых задачах, зрелый API, нативная интеграция с Яндекс-стеком. GigaChat Pro — близкое качество, лучшая интеграция с СберAI экосистемой, выше комфорт enterprise-договоров. Saiga / T-lite — open-source, self-hosted, для команд с MLOps-мощностями и нежеланием отдавать данные. OpenAI / Anthropic через VPN или прокси — лучшее качество, но юридический серый риск + 152-ФЗ violation.
1. Качество на русском (2026)
Усреднённые оценки на стандартных бенчмарках RuMMLU, MERA, RussianSuperGLUE + продовая практика. Шкала 1-10.
| Модель | RuMMLU | MERA | Practical reasoning | RU code-gen |
| YandexGPT 4 Pro | 8.7 | 8.4 | 8.5 | 7.0 |
| GigaChat Pro | 8.5 | 8.2 | 8.2 | 7.5 |
| Saiga 70B (Llama 3.1) | 7.6 | 7.4 | 7.5 | 7.8 |
| T-lite (T-Bank, 7B) | 7.0 | 6.8 | 6.5 | 5.5 |
| GPT-4.5 (через прокси) | 9.2 | 9.0 | 9.3 | 9.0 |
| Claude 4.6 Sonnet (через прокси) | 9.0 | 8.8 | 9.5 | 9.2 |
| DeepSeek V4 (доступен напрямую) | 8.3 | 8.0 | 8.5 | 8.8 |
2. Цена за 1М токенов (₽, 2026-06)
| Модель | Input ₽/M | Output ₽/M | Context window |
| YandexGPT 4 Pro | ~1 600 | ~3 200 | 32K |
| YandexGPT 4 Lite | ~600 | ~1 200 | 32K |
| GigaChat Pro | ~1 800 | ~3 500 | 32K |
| GigaChat Lite | ~700 | ~1 400 | 16K |
| Saiga 70B (self-hosted) | ~300 (только инфра) | ~300 | 32K |
| T-lite 7B (self-hosted) | ~80 (только инфра) | ~80 | 8K |
| DeepSeek V4 (международная цена) | ~25 (цена в USD * курс) | ~100 | 128K |
| GPT-4.5 через прокси | ~600 + наценка прокси (10-30%) | ~1 800 + наценка | 1M |
3. Юридический + 152-ФЗ риск
| Модель | 152-ФЗ residency | Санкционный риск | Договор |
| YandexGPT | да, РФ соответствует | отсутствует безопасно | через Yandex Cloud OAuth |
| GigaChat | да, РФ соответствует | отсутствует безопасно | через Сбер ЕБК |
| Saiga / T-lite (self-hosted) | full control да | отсутствует open-source | OSS-лицензия + ваш host |
| DeepSeek (API) | нет данные в КНР | низкий не санкционен | прямой API |
| OpenAI / Anthropic через прокси | нет явный violation | средний тех. нарушение TOS | прокси-провайдер серый |
Юридическое предупреждение: использование OpenAI / Anthropic через VPN или коммерческие прокси для обработки ПДн граждан РФ — нарушение 152-ФЗ ст. 18 ч. 5 (локализация). Дополнительно нарушаете TOS OpenAI/Anthropic (запрет доступа из РФ). Конкретные правовые последствия зависят от категории обрабатываемых данных и публичности. Для production систем с ПДн — НЕ рекомендуется.
4. Vendor lock-in
| Ось | YandexGPT | GigaChat | Saiga / T-lite | OpenAI/Claude через прокси |
| API уникальность | 4 | 4 | 0 (OpenAI-совместимый) | OpenAI/Anthropic стандарт |
| Fine-tuning portability | 0 (нельзя унести) | 0 (нельзя унести) | 5 (свои чекпоинты) | 0 (нельзя унести) |
| Embeddings | 3 (свои, но переиндексация возможна) | 3 | 5 (вы контролируете) | 3 |
| Контракт | 3 (Yandex Cloud) | 4 (Сбер договор) | 5 (full control) | 2 (через прокси-провайдера) |
| Overall | moderate | moderate-heavy | minimal | low (но юр. риск) |
5. Fine-tuning + Specialty
| Возможность | YandexGPT | GigaChat | Saiga / T-lite |
| SFT / LoRA через API | да, через DataSphere | да, через ML Space | полный контроль локально |
| RAG-первичность | зрело | зрело | зависит от вашей реализации |
| Embeddings API | да | да | есть свои + LaBSE-RU |
| Multimodal (vision) | YandexGPT Vision (beta) | GigaChat Vision (beta) | через LLaVA-RU / external |
| Speech (TTS/STT) рядом | SpeechKit (single bundle) | SaluteSpeech (single bundle) | нужно собирать стек |
6. Поддержка + SLA
| Аспект | YandexGPT | GigaChat | Saiga / T-lite |
| SLA API uptime | 99.95% | 99.9% | n/a (self-hosted) |
| Базовая поддержка | через Yandex Cloud support | через Сбер enterprise channel | community (Telegram) |
| Документация (RU) | обширная + примеры | хорошая | зависит от модели |
| Enterprise-договор | стандартный Yandex Cloud DPA | широкий enterprise-формат | n/a |
Decision rule
- Бизнес с ПДн граждан РФ + стабильное качество — YandexGPT 4 Pro или GigaChat Pro. Выбирайте по тому, в чей облачной экосистеме вы уже сидите.
- Высокая чувствительность данных (банк, медицина, госструктура) — Saiga 70B или T-lite, self-hosted в private cloud / on-prem. MLOps-мощности обязательны.
- Лучшее качество и нет ПДн граждан РФ — GPT-4.5 / Claude 4.6 Sonnet через корпоративный прокси (юридически прозрачнее VPN, но всё равно серая зона по TOS). Альтернатива: DeepSeek V4 (доступен напрямую, цена в разы ниже).
- Тестируете / прототипируете — DeepSeek V4 для качества (открытая зарубежная цена) или Saiga (своя инфра, не платите за пробы).
- Multimodal + sector-specific (медицина, юр, образование) — гибрид: YandexGPT/GigaChat для основного NLP + специализированные модели для домена (Saiga-Medical, T-lite-Legal).
SLAtech помогает спроектировать и развернуть архитектуру с любой из этих моделей, включая гибридные паттерны и self-hosted Saiga / T-lite на private cloud. Связаться ›