Стоимость чатов и токенов
Как формируется цена за диалог с моделями
Основы ценообразования
- Входные токены — системные инструкции, история диалога, ваши сообщения, вложения и подсказки инструментов.
- Выходные токены — сгенерированный ответ модели.
Модели и примерные цены
Таблица ниже показывает, сколько токенов вы получите за 1 кредит (1 ₽) для каждой модели.
| Модель | Ввод | Вывод | Контекст |
|---|---|---|---|
|
Anthropic: Claude Opus 4.5
|
≈ 1.3k токенов/1₽
|
≈ 250 токенов/1₽
|
200 000 токенов контекста |
|
DeepSeek: DeepSeek V3.2
|
≈ 24.4k токенов/1₽
|
≈ 16.4k токенов/1₽
|
131 072 токенов контекста |
|
GigaChat 2 Max
|
≈ 1.1k токенов/1₽
|
≈ 1.1k токенов/1₽
|
131 072 токенов контекста |
|
Google: Gemini 3 Flash Preview
|
≈ 12.5k токенов/1₽
|
≈ 2.1k токенов/1₽
|
1 048 576 токенов контекста |
|
OpenAI: GPT-5 Chat
|
≈ 5k токенов/1₽
|
≈ 625 токенов/1₽
|
128 000 токенов контекста |
|
OpenAI: GPT-5.2 Chat
|
≈ 3.6k токенов/1₽
|
≈ 446 токенов/1₽
|
128 000 токенов контекста |
|
Qwen3 235B Instruct
|
≈ 24.4k токенов/1₽
|
≈ 8.3k токенов/1₽
|
262 000 токенов контекста |
|
Qwen: Qwen3.5-9B
|
≈ 142.9k токенов/1₽
|
≈ 41.7k токенов/1₽
|
262 144 токенов контекста |
|
T-lite-it 1.0
|
≈ 250k токенов/1₽
|
≈ 142.9k токенов/1₽
|
8 000 токенов контекста |
Поиск в интернете
Если для чата включён поиск в интернете и выбранная модель поддерживает эту опцию, к ответу добавляется отдельная строка тарификации сверх стоимости входных и выходных токенов: за каждую зафиксированную в ответе операцию поиска начисляется фиксированная доплата в кредитах чата, независимо от модели.
К стоимости токенов добавляется 1 кредит за каждую операцию поиска (тариф задаётся как 0,5 кредита за операцию с округлением вверх до целого кредита на каждую операцию). Эта сумма целиком относится к ответу ассистента (как часть списания за завершение), а не распределяется на входящие токены.
Если за один ответ модель выполнила несколько операций поиска, доплата умножается на их число.
| Модель | Доплата за 1 операцию поиска (кредиты чата ≈ ₽) |
|---|---|
| Anthropic: Claude Opus 4.5 | ≈ 1 кредитов |
| Google: Gemini 3 Flash Preview | ≈ 1 кредитов |
| OpenAI: GPT-5 Chat | ≈ 1 кредитов |
| OpenAI: GPT-5.2 Chat | ≈ 1 кредитов |
Цифры ориентировочные: доплата начисляется только когда опция поиска действительно включена в чате к моменту запроса.
Как длинный контекст увеличивает расход
Каждый запрос в чат включает не только ваше последнее сообщение, но и историю диалога, системные инструкции и вложения. Чем длиннее контекст, тем больше токенов ввода потребляется и тем дороже становится каждый ответ.
Короткий диалог
1–3 сообщения, без файлов. История короткая, расход токенов ввода минимальный — основную часть стоимости составляет вывод.
Длинная дискуссия
Десятки сообщений. В каждый новый запрос включается большая часть истории, поэтому даже короткий ответ может стоить дороже из-за большого числа входных токенов.
Файлы и RAG
При использовании RAG и больших документов часть текста подмешивается в каждый запрос. Это резко увеличивает расход входных токенов, особенно для моделей с большим контекстом.
Рекомендуем периодически начинать новый чат для крупной темы, удалять лишние сообщения и добавлять краткие резюме, чтобы держать контекст под контролем.
Тарифы и кредиты
Каждый тариф включает месячный пакет кредитов чата. При превышении лимита можно докупить дополнительные кредиты через пополнение баланса.
На странице тарифов указано, сколько кредитов входит в каждый план и какие доп. возможности вы получаете.
Как управлять расходом
- Выбирайте более дешёвые модели для черновиков и быстрых вопросов.
- Разбивайте большие задачи на несколько чатов с короткой историей.
- Периодически очищайте историю или начинайте новый диалог.
- Используйте краткие резюме вместо полного текста документа, если это возможно.
Для стоимости генерации изображений смотрите также таблицу цен для изображений.