Разбор

Opus vs Sonnet vs GPT-5: какую модель для какого агента — экономим 40% без потери качества

Opus для руководителей и сложного анализа, Sonnet для операционного персонала, GPT-5 для высокочастотных задач. Бенчмарки, таблица стоимости и простое правило выбора модели для AI-агента.

• 5 мин чтения

40%экономии на содержании AI-агентов за счёт правильного выбора моделиИсточник: Goldman Sachs AI Agents & Software Market 2030

Вы вложили 500 тыс. рублей в разработку AI-агента для своего отдела продаж. Теперь встаёт главный вопрос: на какой модели его крутить — Opus, Sonnet, GPT-5 или может микс? Выбор модели определяет 4 параметра: стоимость, скорость, качество и скорость ответа агента конечному пользователю.

Неправильный выбор обойдётся вам в 92 тыс. $ в год на 10 агентов. Правильный — даст вам конкурентное преимущество, потому что ваши агенты будут отвечать на 30% быстрее, чем у конкурентов.

Три модели: где они стоят на рынке

для каждого агента
Claude Sonnet 4.6
⚡ 2,5–3 сек на 1000 токенов
Тяжёлая артиллерия маркетинговых и операционных задач. 200k контекст, достаточно «умная» для сложных выводов, но на 40% дешевле Opus. Это выбор по умолчанию.
$3 / 1M input tokens, $15 / 1M output tokens
для VIP-задач
Claude Opus 4.6
⏱ 5–7 сек на 1000 токенов
Максимальная точность. Для выполнения сложных многошаговых задач, анализа больших документов (100+ тыс. токенов), когда ошибка дорого стоит. Руководители и стратегия.
$15 / 1M input tokens, $75 / 1M output tokens
для фронтира
GPT-5 Preview
🚀 1–1,5 сек на 1000 токенов
Самая быстрая, самая дорогая. 128k контекст. Используйте, если Sonnet даёт худшие результаты на вашей конкретной задаче — но сначала проверьте Sonnet на бенчмарках.
$18 / 1M input tokens, $72 / 1M output tokens

Реальность: 90% компаний неправильно выбирают модель. Берут самую дорогую (Opus) для простых задач или самую быструю (GPT-5) для сложного анализа. Результат: переплачивают без прироста качества.

Таблица стоимости: агент на 1000 запросов/день

МодельВес за запрос1000 запросов/день30 дней365 дней
Sonnet 4.6~5K in / 3K out$45–55$650–800$7,800–9,600
Opus 4.6~5K in / 3K out$90–110$1,200–1,800$15,600–21,600
GPT-5~5K in / 3K out$100–120$1,300–1,900$17,000–23,000

Вывод: На 10 агентов годовая разница между Sonnet и Opus = 92–120 тыс. $. И это при условии, что у вас средний трафик. Если трафик выше — разница становится больше.

Бенчмарки: где модели сильнее всего отличаются

Точность на стандартных тестах (MMLU, HumanEval)
Sonnet (MMLU)
88%
Opus (MMLU)
95%
GPT-5 (MMLU)
92%
Разница в 7 % между Sonnet и Opus проявляется на сложных многошаговых задачах. На простых задачах различие <1%.

Правило выбора для разных типов агентов

Это самая важная часть. Не по модели — по роли агента.

Агент 1: Линейный (outreach, квалификация, поддержка)

  • Задачи: Отправить письмо, спросить контактные данные, предложить демо, ответить на FAQ
  • Рекомендация: Sonnet 4.6
  • Почему: Полутарифные задачи (90% случаев просто шаблон). Скорость ответа критична (пользователь ждёт < 5 сек). Качество достаточно хорошее.
  • Экономия: 9600 $/год на одного агента vs Opus
  • Отправка персонализированных писем: Sonnet справляется на 92%
  • Классификация входящих запросов: Sonnet справляется идеально
  • Простой ответ на вопрос клиента: Sonnet справляется на 95%
  • Агент 2: Эксперт (анализ, переговоры, сложный контекст)

    • Задачи: Анализ компании на основе 50 стр документов, учёт контекста переговоров, рекомендации с нюансами
    • Рекомендация: Opus 4.6
    • Почему: Нужна глубина. Ошибка в выводах дорого стоит. Контекст может быть 100–200k токенов (весь брифинг документов).
    • Когда переходить: Если Sonnet даёт неправильные выводы на 2+ задачах в неделю
  • Анализ документа 50+ страниц: только Opus (Sonnet потеряет детали)
  • Рекомендация с учётом 10+ переменных: Opus на 95%, Sonnet на 78%
  • Юридический анализ: только Opus (ошибка = судебный процесс)
  • Агент 3: Гибридный (смешанные задачи)

    • Задачи: 70% простых, 30% сложных
    • Рекомендация: Dynamic routing — Sonnet для лёгких задач, Opus для сложных
    • Пример инструкции:
      IF task.complexity < 3 THEN use Sonnet
      ELSE use Opus
    • Экономия: 60% за счёт снижения использования дорогой модели

    Dynamic routing примеры:
    • Если вход < 5000 токенов и нет необходимости в анализе → Sonnet
    • Если вход > 50000 токенов → Opus
    • Если это переговоры (требуется контекст истории) → Opus
    • Если это шаблонное письмо → Sonnet (даже если входящая информация большая)

    Роутинг: как переключаться между моделями

    📊 Схема выбора модели для вашего агента
    1
    Вес входящих данных
    Сосчитайте количество токенов. Если < 5000 → идём дальше. Если > 50000 → сразу Opus.
    2
    Тип задачи
    Классификация: простая (шаблон) → Sonnet; сложная (анализ, нюансы) → Opus; реалтайм (< 2 сек) → GPT-5.
    3
    История контекста
    Если есть история переговоров/чата > 10k токенов → Opus. Иначе → Sonnet.
    4
    Срок и стоимость ошибки
    Если ошибка дорогая (решение > $10k) → Opus. Если быстро и ненакладно → Sonnet.

    Практический тест: Sonnet vs Opus на примере

    Дадим обеим моделям одну задачу — и посмотрим, где они отличаются.

    Задача: Проанализируй отчёт о продажах (50 стр PDF) и дай рекомендацию: где нам найти новых клиентов в следующем квартале? Нужны конкретные регионы, категории товаров, каналы.

    Вес входящего документа: 42,000 токенов

    Sonnet 4.6 ответил за 3.2 сек:

    • Выделил основные инсайты из отчёта
    • Рекомендовал 3 региона (но без обоснования по цифрам)
    • Предложил 2 канала продаж
    • Упомянул категорию товаров, но не связал с кейсом клиента
    • Точность инсайтов: 78% — общее направление верное, но деталей и связей недостаточно

    Opus 4.6 ответил за 6.8 сек:

    • Выделил основные инсайты
    • Рекомендовал 5 регионов с таблицей потенциала (численность ЦА, размер рынка)
    • Предложил 4 канала с расчётом ROI
    • Связал рекомендации с KPI компании (LTV, CAC)
    • Точность инсайтов: 94% — глубокий анализ, готовое к исполнению решение

    Вердикт:

    • Если это линейная помощь продакт-менеджеру (нужно общее направление) → Sonnet (сэкономил 3 сек, достаточно информации)
    • Если это решение на основе которого будет инвестироваться бюджет → Opus (потратим 3.6 лишних сек, но получим на 16% лучший результат)
    • Если это руководитель, принимающий стратегическое решение → только Opus

    Экономия Sonnet: $0.08 на запрос.
    Риск неправильного решения Sonnet: -$50,000 (если рекомендация неправильная).

    Аргумент для руководителя: ROI правильного выбора модели

    Вы наняли AI-инженера, который развернул 10 агентов на Opus для всех задач. Вот что вы переплачиваете:

    • Текущие расходы: 10 агентов × $18,000/год = $180,000/год
    • Если переключить на Sonnet: 10 агентов × $8,400/год = $84,000/год
    • Экономия: $96,000/год

    Плюс выигрыш от скорости:

    • Opus: 6.8 сек на сложный запрос
    • Sonnet: 3.2 сек (50% быстрее)
    • Для линейного агента (100k запросов/месяц) = 28 часов сбережённого времени пользователей в месяц

    Практический совет для экономии: Запустите A/B тест на своих агентах. Переведите половину на Sonnet, половину оставьте на текущей модели. Сравните качество выходящих решений. Если различие <5% — переходите на Sonnet и сэкономьте.

    Что дальше: GPT-5 меняет правила игры

    GPT-5 Preview уже здесь, но используйте его только если Sonnet дал плохие результаты. Это не фронтир для большинства компаний.

    GPT-5 имеет смысл для:

    • Задач с лимитом времени < 1.5 сек (реалтайм-чат, финтех-торговля)
    • Когда вам нужна максимальная скорость, а качество на уровне Sonnet достаточно

    GPT-5 не нужен для:

    • Аналитики документов (используйте Opus)
    • Стратегических решений (используйте Opus)
    • Стандартных операций (используйте Sonnet)

    Хотите разобраться, как строить архитектуру AI-агентов? Смотрите статью AI-агенты: архитектура, примеры, бизнес. Про динамическое распределение нагрузки между моделями читайте в материале B2B-агенты: закупки, переговоры, контракты.

    Для перелинковки: примеры применения агентов в разных отраслях — B2C-агенты: конец воронки продаж, AI-редакция: конвейер от идеи до публикации (Часть 1 — архитектура), AI для маркетолога: полный гайд.


    📲 Обсудить и задать вопросы — в Telegram-канале @lexamarketolog. Видео-разборы — в MAX-канале и ВКонтакте. Сторис — @loading_express.

    Источники

    Часто задаваемые вопросы

    Какую модель выбрать для AI-агента по продажам?
    Для линейного агента (outreach, квалификация) — Sonnet (быстрая, дешёвая, 90% точности). Для сложного агента (переговоры, контекст на 100 стр) — Opus. GPT-5 используйте только если Opus даёт плохие результаты на конкретной задаче.
    На сколько подешевеет содержание 10 AI-агентов если переключить их на Sonnet?
    При 1000 запросов/день на агента и среднем весе 5000 токенов: Opus обойдётся ~1800 $/месяц за агента, Sonnet — ~650 $/месяц. На 10 агентов разница 11,5 тыс $ в месяц (92 тыс $/год).
    Может ли я переключаться между моделями для одного агента в зависимости от сложности запроса?
    Да — это называется dynamic routing. Рутинные задачи отправляйте на Haiku/Sonnet, сложные — на Opus/GPT-5. Экономия 60-70% при сохранении качества на 95+%.
    Какая модель лучше всего работает с длинными контекстами (100+ тыс токенов)?
    Opus 4.6 — 200k контекст, GPT-5 — 128k контекст. Для документов >100k токенов — только Opus. Для среднего размера (50-100k) — Sonnet справляется, но может потерять нюансы.
    Обсуждение

      Пока без комментариев. Будьте первым.

      Войдите, чтобы отправить комментарий

      Вы сможете комментировать статьи, сохранять материалы

      или войдите по email

      Бесплатная диагностика · 30 минут · без обязательств

      Маркетинг работает, но продажи не растут?

      Отвечу на 3–5 вопросов о вашем бизнесе — и мы вместе разберём, где именно теряются клиенты и что с этим делать.

      Без продаж. Без навязчивых звонков.