Важное

Карпаты выпустил Autoresearch: ИИ-агент сам пишет и оптимизирует код обучения языковых моделей

Андрей Карпаты выпустил Autoresearch — агент сам гоняет эксперименты по обучению LLM. Разбираем, что это меняет в экономике ML-команд и где система даёт сбой.

Лёха Маркетолог • 8 марта 2026 г. • 2 мин чтения

Технически — элегантно. Управленчески — это смена модели найма в ML-командах. Кто это поймёт первым — получит преимущество по скорости итераций.

Алексей Махметхажиев

Андрей Карпаты (экс-директор по ИИ в Tesla, сооснователь OpenAI) опубликовал репозиторий Autoresearch на GitHub. Публикация разошлась по ML-сообществу за сутки. Суть: агент сам ведёт цикл экспериментов по обучению языковых моделей (LLM) без участия исследователя в рутинных итерациях.

Суть без шелухи

Весь код обучения — один файл, ~630 строк, одна GPU. Человек задаёт направление через промпт в .md-файле. Дальше агент работает автономно.

Цикл агента: создать ветку → изменить архитектуру → подобрать оптимизатор → запустить обучение (~5 минут) → проверить validation loss → сохранить улучшение или откатить. Каждая точка на графике — один полный прогон.

Можно запустить несколько агентов с разными промптами параллельно. Побеждает тот, кто быстрее снижает validation loss. Карпаты прямо называет это заменой исследователей, которые "работали между едой и митингами".

Как это ломает или улучшает системы

Скорость итераций — один человек с кластером GPU закрывает объём экспериментов, который раньше требовал команды из 3–5 ML-инженеров. Стоимость одной итерации падает до стоимости вычислений.
Структура затрат ML-команды — CAC (стоимость привлечения клиента) на найм senior ML-исследователей перестаёт окупаться на задачах поиска гиперпараметров и архитектурных переборов. Деньги уходят в GPU-кластер, а человек остаётся на уровне постановки задачи.

Мой рентген

Карпаты прав в главном: узкое место в ML-исследованиях — скорость цикла "гипотеза → эксперимент → вывод". Autoresearch атакует именно это место. Один агент делает за ночь то, что команда делает за спринт.

Где теория упирается в практику: агент оптимизирует то, что можно измерить — validation loss. Но постановка правильной задачи, выбор датасета, интерпретация аномалий — это пока требует человека. Агент не знает, что задача сформулирована неверно.

Второй риск — масштаб без контроля. Рои агентов на кластере генерируют тысячи коммитов. Без жёсткой системы версионирования и аудита это превращается в неуправляемый технический долг. Карпаты решает это через git-ветки и фиксацию только улучшений — но при параллельном запуске агентов с конфликтующими промптами логика схождения неочевидна.

Для бизнеса важна другая цифра: стоимость часа GPU против стоимости часа senior-исследователя. По открытым данным рынка труда — разница на порядок. Экономика очевидна, если задача хорошо формализована.

Вывод

Тезис Карпаты принять и усилить: автономные агенты меняют экономику ML-команд быстрее, чем большинство CTO успевает это заметить. Применять там, где задача чётко измерима. Держать человека на уровне постановки задачи и интерпретации результатов.

Частые вопросы

Что такое Autoresearch от Карпаты и зачем это бизнесу?

Autoresearch — минимальный репозиторий, где ИИ-агент автономно меняет код обучения языковой модели, запускает эксперименты и сохраняет улучшения. Для бизнеса это означает снижение операционных затрат на ML-команду: рутинный перебор гиперпараметров и архитектур уходит к агенту. Человек остаётся на уровне постановки задачи.

Как агент решает, какое изменение сохранить?

Агент фиксирует изменение только если validation loss (ошибка на проверочной выборке) стала ниже предыдущего значения. Каждая итерация — отдельная git-ветка. Если метрика не улучшилась — ветка отбрасывается. Логика простая, но работает только при корректно выбранной метрике оптимизации.

Какой ROI у перехода на агентный подход в ML-команде?

ROI (возврат на инвестиции) зависит от стоимости GPU-часа и ставки исследователя. По открытым данным рынка, senior ML-инженер в России стоит от 400 000 рублей в месяц. Час аренды A100 GPU — около 100–150 рублей. При чётко формализованных задачах окупаемость наступает быстро. Риск: если задача поставлена размыто, агент быстро и дёшево оптимизирует не то. ---

Пока без комментариев. Будьте первым.

Карпаты выпустил Autoresearch: ИИ-агент сам пишет и оптимизирует код обучения языковых моделей

Суть без шелухи

Как это ломает или улучшает системы

Мой рентген

Вывод

Частые вопросы

Реквизиты ИП

Банковские реквизиты

Суть без шелухи

Как это ломает или улучшает системы

Мой рентген

Вывод

Частые вопросы

Читайте также