Разбор

ЛЛМ, агенты, скиллы: как это работает на самом деле

Чат-бот и агент — не одно и то же. ЛЛМ — это ZIP-архив, а не мегаразум. Скилл — это не промт в папке. Разбираю архитектуру: от токенов до мультиагентных систем.

• 8 мин чтения

Посмотрел недавно 108-минутный стрим Сергея с канала «Без иллюзий» — про скиллы в Claude Code. Сел смотреть на 20 минут, досмотрел до конца. Там была одна история, которую я не смог выкинуть из головы.

Один из участников рассказал про юриста, с которым недавно разговаривал. Юрист сказал: «Я не могу работать с нейронками — они не обладают актуальной информацией, я каждый раз за ними 30 раз перепроверяю». Ему ответили: «А почему ты не создашь knowledge base, который обновляется через API?» Юрист не понял вопроса.

Вот этот зазор — между теми, кто понимает архитектуру, и теми, кто не понимает — он сейчас огромный. Решил разобрать основное из стрима в одном месте.

150
скиллов в одной агентной системе — и всё их описание занимает ~10 000 токенов. Меньше одной страницы текста в контексте

Что такое ЛЛМ — без воды

«Здравствуйте, я ChatGPT. Я всего лишь ZIP-архив на 1100 терабайт. Мои знания взяты из интернета, который я прочитал полгода назад. Помню довольно смутно. А мою личность запрограммировали люди на примерах, как надо правильно отвечать.» — метафора из стрима «Без иллюзий»

Вот и вся разгадка. Внутри ЛЛМ нет злого агента, нет мегаразума, который хочет поработить человечество. Это флешка с весами — числовыми представлениями текстов, которые модель читала во время обучения. Очень много текстов. Очень смутно запомненных.

Понимание этого важно: ЛЛМ умеет делать ровно одну вещь — генерировать текст. Она не управляет базами данных, не запускает скрипты, не отправляет письма. Она пишет следующий токен, опираясь на все предыдущие.

Отсюда следует следующий логичный вопрос: как из этой флешки получается агент, который ориентируется в терминале?

Три компонента агента

Первый агент, который по-настоящему зацепил рынок — Claude Code, февраль 2025 года. Он умел то, чего раньше не умел ни один чат-бот: запускать команды в терминале. Читать файлы, писать в них, удалять, переносить. Это была не эволюция промтов. Это была другая архитектура.

🧠
ЛЛМ
Генерирует текст. ChatGPT, Claude, Gemini — это всё просто разные флешки с весами
🔧
Инструменты
CLI-команды: создать, найти, записать, удалить, перенести файл. Базовых команд — 4–5
⚙️
Runtime
Операционная система — ваш Mac, Linux-сервер, Docker-контейнер. Где-то должен крутиться код

Без инструментов — это просто чат-бот. Без runtime — инструменты некуда запускать. Все три части обязательны.

Как работает tool calling под капотом

Это то, что большинство людей не понимает — и именно из-за этого агенты кажутся магией.

«ЛЛМ умеет писать текст. Только текст. Больше ничего. Но модель можно научить оборачивать куски этого текста в специальные теги — и тогда парсер отправит эти куски прямо в терминал как команды.» — из стрима «Без иллюзий»

Вот упрощённый поток того, что происходит когда вы просите агента «найди файл и замени в нём функцию»:

# Агент генерирует текст — часть для человека, часть для машины
Я выполню поиск файла.

<tool:bash>
find . -name “script.sh”
</tool:bash>

# Парсер видит зелёный тег → отправляет команду в терминал
# Терминал возвращает ответ → агент читает его как текст и продолжает

Файл найден. Переписываю функцию.

<tool:write>
if x != y: run()
</tool:write>

Скрипт изменён. Запустить?

Чёрный текст — для нас. Зелёные теги — для терминала. Синий — код. Всё это генерирует одна ЛЛМ, которая умеет только писать текст.

Промты, проекты, скиллы — в чём разница

Было три эпохи. Большинство людей застряли на первой или второй.

Вчера
Промт
Простыня текста: «ты эксперт в области X, твоя задача Y, не делай Z». Ломается при изменении задачи. Требует переписывания. Работает на чат-ботах, не на агентах.
Переходный
Проект
Папка с файлами + инструкция. Грузит всё сразу в контекст → модель путается в версиях документов и галлюцинирует. Хорош для небольших наборов, плох для растущей базы знаний.
Сейчас
Скилл
Модульный. В контекст попадает только 100-токенное описание-указатель. Агент сам решает, какие файлы читать. Только для агентов, не для чат-ботов.

Почему проекты ломаются: представьте, что у вас три версии одного документа в папке — версия 1, версия 2, версия 3. Модель видит их все сразу. В одной написано «90», в другой «92». Она не знает, какая истина. Галлюцинация гарантирована.

Анатомия скилла

Каждый скилл — это папка. Внутри — файл skill.md и набор вспомогательных файлов.

структура скилла / image-skill
skill.md← 100 токенов описания. Агент видит всегда.
use when: “нарисуй”, “сгенерируй картинку”, “image”
do not use for: video, 3d models, audio
→ step 1: читай [[references/models.md]]
→ step 2: если нужен персонаж → читай [[character.md]]
→ step 3: если реклама → читай [[advertising.md]]
→ step 4: финальный prompt-фреймворк

references/models.md← параметры nano-banana, gpt-image
character.md← как работать с персонажем
advertising.md← коммерческая реклама, beverage, e-commerce
golden-rules.md← правила для любого генератора

«В skill.md не написано ничего — как надо работать. Написано только — куда смотреть. Это очень важно. Потому что если бы это был просто промт, там было бы написано: делай то, делай это. Здесь написано: когда нужна реклама — читай вот тот файл.» — из стрима «Без иллюзий»

Вот почему нельзя писать workflow прямо в skill.md. Агент прочитает первые строки, решит, что всё понял, и не полезет дальше в инструкции. Он ленится — как и все. Пишите только указатели: иди туда → читай это → потом читай это.

Когда делать скилл

Простое правило, которое работает:

«Делайте скилл, когда что-то повторяете больше трёх раз. Не нужно делать скилл на каждый чих. Скилл — это для регулярно повторяемых задач.»

Конкретные примеры: проверка почты (правила фильтрации, скрипты доступа, safety guardrails от prompt injection), написание статей (исследование → структура → текст → проверка), генерация изображений (разные модели, разные форматы, разные стили).

5 принципов SOP для скиллов

Standard Operating Procedure — концепция придумана во Вторую мировую войну для быстрого обучения людей на заводах. McDonald’s держит свой SOP на 600 страниц. Big Mac одинаковый в Нью-Йорке и Куала-Лумпуре именно поэтому.

Для агентных скиллов из SOP берут пять принципов:

1
Чек-лист
Самая простая точка входа. Не знаете, с чего начать — составьте чек-лист и дайте его агенту. «Проверь: есть ли три колонки, округлены ли цены, указаны ли суммы в двух валютах».
2
Автор — свежий практик
Лучший автор скилла — тот, кто только что прошёл все этапы задачи руками и набил шишки. Не тот, кто «знает теорию». Именно это и говорит SOP: пишет инструкцию свежий практик.
3
Объясняй причину, не запрещай
«Никогда не округляй цены» — агент однажды округлит, просто потому что задача была большой. «Никогда не округляй цены, потому что однажды мы из-за этого потеряли 12 000 долларов и клиент подал в суд» — агент поймёт. Как люди: запрет без объяснения не работает.
4
Тест на слепом агенте
Агент, который сам написал скилл, скажет: «Отличный скилл!». Запустите нового агента, который этот скилл ни разу не видел — он найдёт дыры. Это аналог теста на новичке в SOP.
5
Pre-flight check
Начало скилла должно проверять окружение: установлен ли нужный пакет, есть ли API-ключ, существует ли нужный файл. Если чего-то нет — стоп, скажи об этом сразу. Иначе агент потратит 5 минут и скажет, что «что-то пошло не так».

Три способа создать скилл

Базовый: попросите агента написать скилл, получите черновик, итерируйте. Простой способ, но не самый эффективный.

Опытный (рекомендуемый): сначала сделайте задачу руками с агентом — он облажается, вы его поправите, он снова облажается. Когда результат наконец устроит — попросите агента зафиксировать весь пройденный путь в скилле. Что делать, что не делать, где ошибки. Лучший скилл — написанный из реальных ошибок.

Исследовательский: если вы вообще не разбираетесь в теме (например, трейдинг), сначала соберите знания через Deep Research в нескольких инструментах, а потом уже создавайте скилл на основе собранного материала.

Скиллы vs автоматизации

Автоматизации в n8n, Make, Zapier — детерминированные: каждый шаг прописан, каждый коннектор зафиксирован. Когда Supabase поменяет метод вызова в API — всё падает. Некому починить.

«Автоматизации работают ровно до тех пор, пока не работают. Агентства, которые занимались только автоматизациями — к концу 2025 года начали массово закрываться. Потому что всё, что они настраивали неделями, перестало работать.»

Скилл — это та же автоматизация, но рядом сидит агент. Он знает, что должно произойти в итоге. Когда скрипт возвращает ошибку, агент смотрит — в скилле прописано, как чинить. Берёт и чинит.

Скиллы нужны вместе с агентами именно потому, что агенты умеют и запускать автоматизации, и чинить их.

Мультиагентные системы внутри скилла

Это то, о чём почти не говорят публично, хотя Claude Code и Codex поддерживают это из коробки.

Внутри скилла можно написать текстом: «вызови двух агентов». Один идёт в базу знаний, второй делает онлайн-ресёрч. Оба возвращают данные третьему агенту-писателю. Писатель отдаёт результат главному агенту на проверку. Если окей — output. Если нет — цикл повторяется.

Никакого кода. Никакого оркестратора. Просто текст в skill.md.

Три слоя AI-first компании

1
Экспертный слой
Люди с доменными знаниями. Строители, бухгалтеры, маркетологи, юристы. Без реальной экспертизы агенты пишут красивую ерунду.
2
Операционный слой
Оператор или бизнес-аналитик переводит экспертизу через SOP в скиллы. Это мост между знанием эксперта и возможностями агента.
3
Инфраструктурный слой
API, база знаний, runtime. Ваш сервер. Без этого скиллы некуда запускать — они живут у вас в ноутбуке, а не в компании.

Технарь без экспертизы проиграет. Эксперт без инфраструктуры — тоже. Только все три слоя вместе дают рабочую AI-структуру.

Что произойдёт, если написать в skill.md пошаговый workflow «сделай А, потом Б, потом В»?

Правильно. Агент читает описание в skill.md и если там написаны конкретные шаги — он решает, что всё понял, и не идёт читать детальные инструкции в других файлах. Поэтому в skill.md пишут только указатели: «если нужно X — читай файл Y». А сам workflow — в отдельных файлах, на которые ссылается skill.md.

Источники

  • Стрим «Всё что вы хотели знать про skills, но боялись спросить» — канал БЕЗ ИЛЛЮЗИЙ, 108 минут, май 2026
  • skills.sh — каталог скиллов для Claude Code, 1,5 млн+ установок
  • Claude Code Skills — официальная документация Anthropic

Источники

Часто задаваемые вопросы

Чем агент отличается от чат-бота?
Чат-бот принимает текст и возвращает текст — всё. Агент, помимо этого, умеет вызывать инструменты (CLI-команды, API, скрипты), читать и писать файлы, запускать код и управлять другими агентами. Для этого ЛЛМ нужны три вещи: сама языковая модель, инструменты (tool calling через XML-теги) и runtime — операционная среда (ваш компьютер или сервер).
Что такое tool calling и как агент запускает команды?
Tool calling — это умение ЛЛМ оборачивать куски текста в XML-теги. Парсер распознаёт эти теги и отправляет соответствующие команды в CLI (терминал). Агент буквально пишет текст — но часть этого текста, обёрнутая в зелёные теги-инструменты, уходит в терминал как команда. Ответ терминала возвращается агенту тоже как текст. Никакой магии.
Чем скилл отличается от проекта в Claude?
Проект загружает все файлы в контекст сразу — модель путается и галлюцинирует при большом количестве документов. Скилл модульный: в контекст попадает только 100-токенное описание каждого скилла (указатель). Агент сам выбирает, какие файлы читать, в зависимости от задачи. Это называется progressive disclosure — прогрессивное раскрытие.
Когда нужно делать скилл?
Когда вы повторяете одно и то же больше трёх раз. Скиллы нужны для регулярно повторяемых задач: проверка почты, написание статей, генерация картинок, коммерческие предложения. Для разовых задач скилл избыточен.
Что такое SOP и зачем он нужен для скиллов?
Standard Operating Procedure (SOP) — инструкция, придуманная во Вторую мировую войну для быстрого обучения людей на заводах. Для скиллов из SOP берут 5 принципов: чек-лист, свежий практик как автор, объяснение причин (не запреты), тест на слепом агенте, pre-flight check окружения. McDonald's держит SOP на 600 страниц — именно поэтому Big Mac одинаковый везде.
Из чего состоит AI-first компания?
Из трёх слоёв: экспертный (люди с доменными знаниями), операционный (оператор переводит экспертизу через SOP в скиллы) и инфраструктурный (API, база знаний, runtime). Без всех трёх слоёв полноценная AI-структура не работает. Технарь без экспертизы проигрывает. Эксперт без инфраструктуры — тоже.
Обсуждение

    Пока без комментариев. Будьте первым.

    Войдите, чтобы отправить комментарий

    Вы сможете комментировать статьи, сохранять материалы

    или войдите по email

    Бесплатная диагностика · 30 минут · без обязательств

    Маркетинг работает, но продажи не растут?

    Отвечу на 3–5 вопросов о вашем бизнесе — и мы вместе разберём, где именно теряются клиенты и что с этим делать.

    Без продаж. Без навязчивых звонков.