Важное

GPT-5.5: OpenAI делает ставку на агентную работу, а не на чат

Краш-тест GPT-5.5: что реально умеет новая модель OpenAI, сколько стоит, как выглядит против Claude и Gemini. Вердикт для бизнеса — внедрять или ждать.

• 3 мин чтения

Модель для тех, кто устал перепроверять ИИ вручную — но вопрос, насколько это работает за пределами бенчмарков.

Лёха МаркетологЛёха Маркетолог

OpenAI анонсировала GPT-5.5 как модель нового класса с акцентом на агентные сценарии. Целевая аудитория — команды, где ИИ встроен в рабочие процессы: разработка, аналитика, работа с документами. Доступна в ChatGPT и Codex для подписок Plus, Pro, Business и Enterprise.


Что под капотом (Реальный функционал)

  • Агентное завершение задач — модель самостоятельно проверяет промежуточные результаты и итерирует до финала. По данным компании, это снижает количество ручных перепроверок в длинных цепочках задач.
  • Работа с инструментами — уверенное использование внешних инструментов (код-интерпретатор, веб-поиск, API-вызовы) без деградации контекста на длинных задачах.
  • Код и ресёрч — на Terminal-Bench: 82,7% против 69% у Claude (актуальной версии на момент публикации). Источник — данные компании.
  • Работа с документами — усиленный анализ структурированных и неструктурированных источников. Конкретные метрики по этому блоку OpenAI не раскрыла.

Цена вопроса (Тарифы и экономика)

GPT-5.5 доступна в рамках существующих подписок без доплаты:

  • Plus — ~$20/месяц
  • Pro — ~$200/месяц
  • Business / Enterprise — по договорным тарифам

Через API цена, по рыночным ориентирам 2026 года, ожидается в диапазоне $10–20 за 1 млн токенов на вход. Официального прайса по API на дату публикации нет. Для команды из 5 человек на подписке Plus экономика простая: если модель экономит 2–3 часа ручной аналитики в неделю на сотрудника, подписка окупается в первый же месяц.


Сравнение лоб в лоб с конкурентами

Параметр GPT-5.5 Claude (Anthropic) Gemini 2.0 Ultra (Google)
Главная фича Агентное завершение задач + самопроверка Длинный контекст, работа с документами Мультимодальность + интеграция с экосистемой Google
Бенчмарк (код) 82,7% Terminal-Bench 69% Terminal-Bench Данных по Terminal-Bench нет
Цена / порог входа От $20/мес (Plus) От $20/мес (Claude Pro) От $19.99/мес (Gemini Advanced)
API Ожидается ~$10–20 / 1M токенов $15 / 1M токенов (Sonnet) $7 / 1M токенов (Flash), Ultra — выше
Кому подходит Разработчики, аналитики, агентные пайплайны Юристы, редакторы, длинные документы Команды внутри Google Workspace
Codex / агентная среда Встроена в Codex Нет нативной агентной среды Интеграция через Vertex AI

Плюсы и минусы (Без розовых очков)

Где сервис разгоняет систему (Плюсы):

  • Самопроверка результатов сокращает итерации в цепочках задач — особенно ощутимо в коде и многошаговой аналитике.
  • Встроенная связка с Codex даёт готовый агентный стек без самодельных оркестраторов.
  • Разрыв в 13,7 п.п. на Terminal-Bench — значимый, если задача — автоматизация работы с терминалом и кодом.
  • Доступна по уже оплаченным подпискам: нулевой порог для существующих клиентов.

Где сервис станет узким местом (Минусы):

  • Бенчмарки — данные компании. Независимая верификация на реальных задачах бизнеса займёт время.
  • Агентные сценарии требуют зрелой инфраструктуры: оркестраторы, логирование, обработка ошибок. Без этого самопроверка модели — иллюзия контроля.
  • Enterprise-тарифы непрозрачны. Реальная стоимость при масштабировании на 50+ пользователей неизвестна до переговоров с продажниками OpenAI.
  • Работа с документами заявлена как усиленная — но без цифр это маркетинг, а не характеристика.
  • Зависимость от экосистемы OpenAI: при смене модели — переработка промптов и агентной логики.

Вывод: кому внедрять завтра, а кому пройти мимо

Внедрять сейчас стоит командам, где ИИ уже встроен в процессы разработки или аналитики. Если у вас есть Codex-пайплайны или агентные сценарии на GPT-4o/5 — апгрейд бесплатный в рамках подписки. Стоимость тестирования: ноль.

Для среднего бизнеса без выстроенных агентных процессов GPT-5.5 пока избыточна. Главная ценность — в агентном режиме. Если задачи решаются через чат или простые вызовы API, прирост будет незначительным.

Крупному Enterprise стоит запустить контролируемый пилот на одном рабочем потоке (например, автоматизация code review или аналитических отчётов). Измерить экономию времени в часах. Масштабировать только после получения внутренних данных — бенчмарки OpenAI не отвечают на вопрос о возврате инвестиций (ROI) в вашем конкретном процессе.

Поделиться: Telegram

Частые вопросы

Чем GPT-5.5 отличается от GPT-5?

GPT-5.5 смещает акцент с генерации текста на завершение многошаговых задач. Ключевое добавление — механизм самопроверки результатов и усиленная работа с инструментами в агентных сценариях. По данным компании, результат на Terminal-Bench вырос до 82,7%.

Нужно ли переписывать промпты и агентные цепочки при переходе с GPT-5 на GPT-5.5?

Совместимость с API OpenAI сохраняется. Однако агентные пайплайны, заточенные под поведение GPT-5, могут давать непредсказуемый выход: модель теперь итерирует самостоятельно. Перед переводом продакшн-среды — обязателен тестовый контур.

Какой ROI (возврат инвестиций) ожидать от GPT-5.5 в B2B?

Прямого ответа нет без замера на вашем процессе. Ориентир: если один аналитик или разработчик экономит 3 часа в неделю — при ставке от 2 000 руб/час это 24 000 руб/мес экономии на человека. Подписка Plus стоит ~1 800 руб/мес по текущему курсу. Математика сходится быстро — при условии, что сценарии подобраны корректно. ---

Обсуждение

    Пока без комментариев. Будьте первым.

    Войдите, чтобы отправить комментарий

    Вы сможете комментировать статьи, сохранять материалы

    или войдите по email

    Бесплатная диагностика · 30 минут · без обязательств

    Маркетинг работает, но продажи не растут?

    Отвечу на 3–5 вопросов о вашем бизнесе — и мы вместе разберём, где именно теряются клиенты и что с этим делать.

    Без продаж. Без навязчивых звонков.