Разбор
Opus vs Sonnet vs GPT-5: какую модель для какого агента — экономим 40% без потери качества
Opus для руководителей и сложного анализа, Sonnet для операционного персонала, GPT-5 для высокочастотных задач. Бенчмарки, таблица стоимости и простое правило выбора модели для AI-агента.
Вы вложили 500 тыс. рублей в разработку AI-агента для своего отдела продаж. Теперь встаёт главный вопрос: на какой модели его крутить — Opus, Sonnet, GPT-5 или может микс? Выбор модели определяет 4 параметра: стоимость, скорость, качество и скорость ответа агента конечному пользователю.
Неправильный выбор обойдётся вам в 92 тыс. $ в год на 10 агентов. Правильный — даст вам конкурентное преимущество, потому что ваши агенты будут отвечать на 30% быстрее, чем у конкурентов.
Три модели: где они стоят на рынке
Реальность: 90% компаний неправильно выбирают модель. Берут самую дорогую (Opus) для простых задач или самую быструю (GPT-5) для сложного анализа. Результат: переплачивают без прироста качества.
Таблица стоимости: агент на 1000 запросов/день
| Модель | Вес за запрос | 1000 запросов/день | 30 дней | 365 дней |
|---|---|---|---|---|
| Sonnet 4.6 | ~5K in / 3K out | $45–55 | $650–800 | $7,800–9,600 |
| Opus 4.6 | ~5K in / 3K out | $90–110 | $1,200–1,800 | $15,600–21,600 |
| GPT-5 | ~5K in / 3K out | $100–120 | $1,300–1,900 | $17,000–23,000 |
Вывод: На 10 агентов годовая разница между Sonnet и Opus = 92–120 тыс. $. И это при условии, что у вас средний трафик. Если трафик выше — разница становится больше.
Бенчмарки: где модели сильнее всего отличаются
Правило выбора для разных типов агентов
Это самая важная часть. Не по модели — по роли агента.
Агент 1: Линейный (outreach, квалификация, поддержка)
- Задачи: Отправить письмо, спросить контактные данные, предложить демо, ответить на FAQ
- Рекомендация: Sonnet 4.6
- Почему: Полутарифные задачи (90% случаев просто шаблон). Скорость ответа критична (пользователь ждёт < 5 сек). Качество достаточно хорошее.
- Экономия: 9600 $/год на одного агента vs Opus
Агент 2: Эксперт (анализ, переговоры, сложный контекст)
- Задачи: Анализ компании на основе 50 стр документов, учёт контекста переговоров, рекомендации с нюансами
- Рекомендация: Opus 4.6
- Почему: Нужна глубина. Ошибка в выводах дорого стоит. Контекст может быть 100–200k токенов (весь брифинг документов).
- Когда переходить: Если Sonnet даёт неправильные выводы на 2+ задачах в неделю
Агент 3: Гибридный (смешанные задачи)
- Задачи: 70% простых, 30% сложных
- Рекомендация: Dynamic routing — Sonnet для лёгких задач, Opus для сложных
- Пример инструкции:
IF task.complexity < 3 THEN use Sonnet ELSE use Opus - Экономия: 60% за счёт снижения использования дорогой модели
Dynamic routing примеры:
• Если вход < 5000 токенов и нет необходимости в анализе → Sonnet
• Если вход > 50000 токенов → Opus
• Если это переговоры (требуется контекст истории) → Opus
• Если это шаблонное письмо → Sonnet (даже если входящая информация большая)
Роутинг: как переключаться между моделями
Практический тест: Sonnet vs Opus на примере
Дадим обеим моделям одну задачу — и посмотрим, где они отличаются.
Задача: Проанализируй отчёт о продажах (50 стр PDF) и дай рекомендацию: где нам найти новых клиентов в следующем квартале? Нужны конкретные регионы, категории товаров, каналы.
Вес входящего документа: 42,000 токенов
Sonnet 4.6 ответил за 3.2 сек:
- Выделил основные инсайты из отчёта
- Рекомендовал 3 региона (но без обоснования по цифрам)
- Предложил 2 канала продаж
- Упомянул категорию товаров, но не связал с кейсом клиента
- Точность инсайтов: 78% — общее направление верное, но деталей и связей недостаточно
Opus 4.6 ответил за 6.8 сек:
- Выделил основные инсайты
- Рекомендовал 5 регионов с таблицей потенциала (численность ЦА, размер рынка)
- Предложил 4 канала с расчётом ROI
- Связал рекомендации с KPI компании (LTV, CAC)
- Точность инсайтов: 94% — глубокий анализ, готовое к исполнению решение
Вердикт:
- Если это линейная помощь продакт-менеджеру (нужно общее направление) → Sonnet (сэкономил 3 сек, достаточно информации)
- Если это решение на основе которого будет инвестироваться бюджет → Opus (потратим 3.6 лишних сек, но получим на 16% лучший результат)
- Если это руководитель, принимающий стратегическое решение → только Opus
Экономия Sonnet: $0.08 на запрос.
Риск неправильного решения Sonnet: -$50,000 (если рекомендация неправильная).
Аргумент для руководителя: ROI правильного выбора модели
Вы наняли AI-инженера, который развернул 10 агентов на Opus для всех задач. Вот что вы переплачиваете:
- Текущие расходы: 10 агентов × $18,000/год = $180,000/год
- Если переключить на Sonnet: 10 агентов × $8,400/год = $84,000/год
- Экономия: $96,000/год
Плюс выигрыш от скорости:
- Opus: 6.8 сек на сложный запрос
- Sonnet: 3.2 сек (50% быстрее)
- Для линейного агента (100k запросов/месяц) = 28 часов сбережённого времени пользователей в месяц
Практический совет для экономии: Запустите A/B тест на своих агентах. Переведите половину на Sonnet, половину оставьте на текущей модели. Сравните качество выходящих решений. Если различие <5% — переходите на Sonnet и сэкономьте.
Что дальше: GPT-5 меняет правила игры
GPT-5 Preview уже здесь, но используйте его только если Sonnet дал плохие результаты. Это не фронтир для большинства компаний.
GPT-5 имеет смысл для:
- Задач с лимитом времени < 1.5 сек (реалтайм-чат, финтех-торговля)
- Когда вам нужна максимальная скорость, а качество на уровне Sonnet достаточно
GPT-5 не нужен для:
- Аналитики документов (используйте Opus)
- Стратегических решений (используйте Opus)
- Стандартных операций (используйте Sonnet)
Хотите разобраться, как строить архитектуру AI-агентов? Смотрите статью AI-агенты: архитектура, примеры, бизнес. Про динамическое распределение нагрузки между моделями читайте в материале B2B-агенты: закупки, переговоры, контракты.
Для перелинковки: примеры применения агентов в разных отраслях — B2C-агенты: конец воронки продаж, AI-редакция: конвейер от идеи до публикации (Часть 1 — архитектура), AI для маркетолога: полный гайд.
📲 Обсудить и задать вопросы — в Telegram-канале @lexamarketolog. Видео-разборы — в MAX-канале и ВКонтакте. Сторис — @loading_express.
Источники
Читайте также
Часто задаваемые вопросы
- Какую модель выбрать для AI-агента по продажам?
- Для линейного агента (outreach, квалификация) — Sonnet (быстрая, дешёвая, 90% точности). Для сложного агента (переговоры, контекст на 100 стр) — Opus. GPT-5 используйте только если Opus даёт плохие результаты на конкретной задаче.
- На сколько подешевеет содержание 10 AI-агентов если переключить их на Sonnet?
- При 1000 запросов/день на агента и среднем весе 5000 токенов: Opus обойдётся ~1800 $/месяц за агента, Sonnet — ~650 $/месяц. На 10 агентов разница 11,5 тыс $ в месяц (92 тыс $/год).
- Может ли я переключаться между моделями для одного агента в зависимости от сложности запроса?
- Да — это называется dynamic routing. Рутинные задачи отправляйте на Haiku/Sonnet, сложные — на Opus/GPT-5. Экономия 60-70% при сохранении качества на 95+%.
- Какая модель лучше всего работает с длинными контекстами (100+ тыс токенов)?
- Opus 4.6 — 200k контекст, GPT-5 — 128k контекст. Для документов >100k токенов — только Opus. Для среднего размера (50-100k) — Sonnet справляется, но может потерять нюансы.
Пока без комментариев. Будьте первым.