Какую модель выбрать для AI-агента по продажам?

Для линейного агента (outreach, квалификация) — Sonnet (быстрая, дешёвая, 90% точности). Для сложного агента (переговоры, контекст на 100 стр) — Opus. GPT-5 используйте только если Opus даёт плохие результаты на конкретной задаче.

На сколько подешевеет содержание 10 AI-агентов если переключить их на Sonnet?

При 1000 запросов/день на агента и среднем весе 5000 токенов: Opus обойдётся ~1800 $/месяц за агента, Sonnet — ~650 $/месяц. На 10 агентов разница 11,5 тыс $ в месяц (92 тыс $/год).

Может ли я переключаться между моделями для одного агента в зависимости от сложности запроса?

Да — это называется dynamic routing. Рутинные задачи отправляйте на Haiku/Sonnet, сложные — на Opus/GPT-5. Экономия 60-70% при сохранении качества на 95+%.

Какая модель лучше всего работает с длинными контекстами (100+ тыс токенов)?

Opus 4.6 — 200k контекст, GPT-5 — 128k контекст. Для документов >100k токенов — только Opus. Для среднего размера (50-100k) — Sonnet справляется, но может потерять нюансы.

Разбор

Opus vs Sonnet vs GPT-5: какую модель для какого агента — экономим 40% без потери качества

Opus для руководителей и сложного анализа, Sonnet для операционного персонала, GPT-5 для высокочастотных задач. Бенчмарки, таблица стоимости и простое правило выбора модели для AI-агента.

Лёха Маркетолог • 26.03.2026 • 5 мин чтения

40%экономии на содержании AI-агентов за счёт правильного выбора моделиИсточник: Goldman Sachs AI Agents & Software Market 2030

Вы вложили 500 тыс. рублей в разработку AI-агента для своего отдела продаж. Теперь встаёт главный вопрос: на какой модели его крутить — Opus, Sonnet, GPT-5 или может микс? Выбор модели определяет 4 параметра: стоимость, скорость, качество и скорость ответа агента конечному пользователю.

Неправильный выбор обойдётся вам в 92 тыс. $ в год на 10 агентов. Правильный — даст вам конкурентное преимущество, потому что ваши агенты будут отвечать на 30% быстрее, чем у конкурентов.

Три модели: где они стоят на рынке

для каждого агента

Claude Sonnet 4.6

⚡ 2,5–3 сек на 1000 токенов

Тяжёлая артиллерия маркетинговых и операционных задач. 200k контекст, достаточно «умная» для сложных выводов, но на 40% дешевле Opus. Это выбор по умолчанию.

$3 / 1M input tokens, $15 / 1M output tokens

для VIP-задач

Claude Opus 4.6

⏱ 5–7 сек на 1000 токенов

Максимальная точность. Для выполнения сложных многошаговых задач, анализа больших документов (100+ тыс. токенов), когда ошибка дорого стоит. Руководители и стратегия.

$15 / 1M input tokens, $75 / 1M output tokens

для фронтира

GPT-5 Preview

🚀 1–1,5 сек на 1000 токенов

Самая быстрая, самая дорогая. 128k контекст. Используйте, если Sonnet даёт худшие результаты на вашей конкретной задаче — но сначала проверьте Sonnet на бенчмарках.

$18 / 1M input tokens, $72 / 1M output tokens

Реальность: 90% компаний неправильно выбирают модель. Берут самую дорогую (Opus) для простых задач или самую быструю (GPT-5) для сложного анализа. Результат: переплачивают без прироста качества.

Таблица стоимости: агент на 1000 запросов/день

Модель	Вес за запрос	1000 запросов/день	30 дней	365 дней
Sonnet 4.6	~5K in / 3K out	$45–55	$650–800	$7,800–9,600
Opus 4.6	~5K in / 3K out	$90–110	$1,200–1,800	$15,600–21,600
GPT-5	~5K in / 3K out	$100–120	$1,300–1,900	$17,000–23,000

Вывод: На 10 агентов годовая разница между Sonnet и Opus = 92–120 тыс. $. И это при условии, что у вас средний трафик. Если трафик выше — разница становится больше.

Бенчмарки: где модели сильнее всего отличаются

Точность на стандартных тестах (MMLU, HumanEval)

Sonnet (MMLU)

88%

Opus (MMLU)

95%

GPT-5 (MMLU)

92%

Разница в 7 % между Sonnet и Opus проявляется на сложных многошаговых задачах. На простых задачах различие <1%.

Правило выбора для разных типов агентов

Это самая важная часть. Не по модели — по роли агента.

Агент 1: Линейный (outreach, квалификация, поддержка)

Задачи: Отправить письмо, спросить контактные данные, предложить демо, ответить на FAQ
Рекомендация: Sonnet 4.6
Почему: Полутарифные задачи (90% случаев просто шаблон). Скорость ответа критична (пользователь ждёт < 5 сек). Качество достаточно хорошее.
Экономия: 9600 $/год на одного агента vs Opus

Отправка персонализированных писем: Sonnet справляется на 92%

Классификация входящих запросов: Sonnet справляется идеально

Простой ответ на вопрос клиента: Sonnet справляется на 95%

Агент 2: Эксперт (анализ, переговоры, сложный контекст)

Задачи: Анализ компании на основе 50 стр документов, учёт контекста переговоров, рекомендации с нюансами
Рекомендация: Opus 4.6
Почему: Нужна глубина. Ошибка в выводах дорого стоит. Контекст может быть 100–200k токенов (весь брифинг документов).
Когда переходить: Если Sonnet даёт неправильные выводы на 2+ задачах в неделю

Анализ документа 50+ страниц: только Opus (Sonnet потеряет детали)

Рекомендация с учётом 10+ переменных: Opus на 95%, Sonnet на 78%

Юридический анализ: только Opus (ошибка = судебный процесс)

Агент 3: Гибридный (смешанные задачи)

Задачи: 70% простых, 30% сложных
Рекомендация: Dynamic routing — Sonnet для лёгких задач, Opus для сложных

Пример инструкции:

IF task.complexity < 3 THEN use Sonnet
ELSE use Opus

Экономия: 60% за счёт снижения использования дорогой модели

Dynamic routing примеры:
• Если вход < 5000 токенов и нет необходимости в анализе → Sonnet
• Если вход > 50000 токенов → Opus
• Если это переговоры (требуется контекст истории) → Opus
• Если это шаблонное письмо → Sonnet (даже если входящая информация большая)

Роутинг: как переключаться между моделями

📊 Схема выбора модели для вашего агента

Вес входящих данных

Сосчитайте количество токенов. Если < 5000 → идём дальше. Если > 50000 → сразу Opus.

Тип задачи

Классификация: простая (шаблон) → Sonnet; сложная (анализ, нюансы) → Opus; реалтайм (< 2 сек) → GPT-5.

История контекста

Если есть история переговоров/чата > 10k токенов → Opus. Иначе → Sonnet.

Срок и стоимость ошибки

Если ошибка дорогая (решение > $10k) → Opus. Если быстро и ненакладно → Sonnet.

Практический тест: Sonnet vs Opus на примере

Дадим обеим моделям одну задачу — и посмотрим, где они отличаются.

Задача: Проанализируй отчёт о продажах (50 стр PDF) и дай рекомендацию: где нам найти новых клиентов в следующем квартале? Нужны конкретные регионы, категории товаров, каналы.

Вес входящего документа: 42,000 токенов

Sonnet 4.6 ответил за 3.2 сек:

Выделил основные инсайты из отчёта
Рекомендовал 3 региона (но без обоснования по цифрам)
Предложил 2 канала продаж
Упомянул категорию товаров, но не связал с кейсом клиента
Точность инсайтов: 78% — общее направление верное, но деталей и связей недостаточно

Opus 4.6 ответил за 6.8 сек:

Выделил основные инсайты
Рекомендовал 5 регионов с таблицей потенциала (численность ЦА, размер рынка)
Предложил 4 канала с расчётом ROI
Связал рекомендации с KPI компании (LTV, CAC)
Точность инсайтов: 94% — глубокий анализ, готовое к исполнению решение

Вердикт:

Если это линейная помощь продакт-менеджеру (нужно общее направление) → Sonnet (сэкономил 3 сек, достаточно информации)
Если это решение на основе которого будет инвестироваться бюджет → Opus (потратим 3.6 лишних сек, но получим на 16% лучший результат)
Если это руководитель, принимающий стратегическое решение → только Opus

Экономия Sonnet: $0.08 на запрос.
Риск неправильного решения Sonnet: -$50,000 (если рекомендация неправильная).

Аргумент для руководителя: ROI правильного выбора модели

Вы наняли AI-инженера, который развернул 10 агентов на Opus для всех задач. Вот что вы переплачиваете:

Текущие расходы: 10 агентов × $18,000/год = $180,000/год
Если переключить на Sonnet: 10 агентов × $8,400/год = $84,000/год
Экономия: $96,000/год

Плюс выигрыш от скорости:

Opus: 6.8 сек на сложный запрос
Sonnet: 3.2 сек (50% быстрее)
Для линейного агента (100k запросов/месяц) = 28 часов сбережённого времени пользователей в месяц

Практический совет для экономии: Запустите A/B тест на своих агентах. Переведите половину на Sonnet, половину оставьте на текущей модели. Сравните качество выходящих решений. Если различие <5% — переходите на Sonnet и сэкономьте.

Что дальше: GPT-5 меняет правила игры

GPT-5 Preview уже здесь, но используйте его только если Sonnet дал плохие результаты. Это не фронтир для большинства компаний.

GPT-5 имеет смысл для:

Задач с лимитом времени < 1.5 сек (реалтайм-чат, финтех-торговля)
Когда вам нужна максимальная скорость, а качество на уровне Sonnet достаточно

GPT-5 не нужен для:

Аналитики документов (используйте Opus)
Стратегических решений (используйте Opus)
Стандартных операций (используйте Sonnet)

Хотите разобраться, как строить архитектуру AI-агентов? Смотрите статью AI-агенты: архитектура, примеры, бизнес. Про динамическое распределение нагрузки между моделями читайте в материале B2B-агенты: закупки, переговоры, контракты.

Для перелинковки: примеры применения агентов в разных отраслях — B2C-агенты: конец воронки продаж, AI-редакция: конвейер от идеи до публикации (Часть 1 — архитектура), AI для маркетолога: полный гайд.

📲 Обсудить и задать вопросы — в Telegram-канале @lexamarketolog. Видео-разборы — в MAX-канале и ВКонтакте. Сторис — @loading_express.

Источники

Часто задаваемые вопросы

Какую модель выбрать для AI-агента по продажам?: Для линейного агента (outreach, квалификация) — Sonnet (быстрая, дешёвая, 90% точности). Для сложного агента (переговоры, контекст на 100 стр) — Opus. GPT-5 используйте только если Opus даёт плохие результаты на конкретной задаче.
На сколько подешевеет содержание 10 AI-агентов если переключить их на Sonnet?: При 1000 запросов/день на агента и среднем весе 5000 токенов: Opus обойдётся ~1800 $/месяц за агента, Sonnet — ~650 $/месяц. На 10 агентов разница 11,5 тыс $ в месяц (92 тыс $/год).
Может ли я переключаться между моделями для одного агента в зависимости от сложности запроса?: Да — это называется dynamic routing. Рутинные задачи отправляйте на Haiku/Sonnet, сложные — на Opus/GPT-5. Экономия 60-70% при сохранении качества на 95+%.
Какая модель лучше всего работает с длинными контекстами (100+ тыс токенов)?: Opus 4.6 — 200k контекст, GPT-5 — 128k контекст. Для документов >100k токенов — только Opus. Для среднего размера (50-100k) — Sonnet справляется, но может потерять нюансы.

Пока без комментариев. Будьте первым.

Opus vs Sonnet vs GPT-5: какую модель для какого агента — экономим 40% без потери качества

Три модели: где они стоят на рынке

Таблица стоимости: агент на 1000 запросов/день

Бенчмарки: где модели сильнее всего отличаются

Правило выбора для разных типов агентов

Агент 1: Линейный (outreach, квалификация, поддержка)

Агент 2: Эксперт (анализ, переговоры, сложный контекст)

Агент 3: Гибридный (смешанные задачи)

Роутинг: как переключаться между моделями

Практический тест: Sonnet vs Opus на примере

Аргумент для руководителя: ROI правильного выбора модели

Что дальше: GPT-5 меняет правила игры

Источники

Часто задаваемые вопросы

Реквизиты ИП

Банковские реквизиты

Три модели: где они стоят на рынке

Таблица стоимости: агент на 1000 запросов/день

Бенчмарки: где модели сильнее всего отличаются

Правило выбора для разных типов агентов

Агент 1: Линейный (outreach, квалификация, поддержка)

Агент 2: Эксперт (анализ, переговоры, сложный контекст)

Агент 3: Гибридный (смешанные задачи)

Роутинг: как переключаться между моделями

Практический тест: Sonnet vs Opus на примере

Аргумент для руководителя: ROI правильного выбора модели

Что дальше: GPT-5 меняет правила игры

Источники

Читайте также

Часто задаваемые вопросы