Разбор
ЛЛМ, агенты, скиллы: как это работает на самом деле
Чат-бот и агент — не одно и то же. ЛЛМ — это ZIP-архив, а не мегаразум. Скилл — это не промт в папке. Разбираю архитектуру: от токенов до мультиагентных систем.
Посмотрел недавно 108-минутный стрим Сергея с канала «Без иллюзий» — про скиллы в Claude Code. Сел смотреть на 20 минут, досмотрел до конца. Там была одна история, которую я не смог выкинуть из головы.
Один из участников рассказал про юриста, с которым недавно разговаривал. Юрист сказал: «Я не могу работать с нейронками — они не обладают актуальной информацией, я каждый раз за ними 30 раз перепроверяю». Ему ответили: «А почему ты не создашь knowledge base, который обновляется через API?» Юрист не понял вопроса.
Вот этот зазор — между теми, кто понимает архитектуру, и теми, кто не понимает — он сейчас огромный. Решил разобрать основное из стрима в одном месте.
Что такое ЛЛМ — без воды
«Здравствуйте, я ChatGPT. Я всего лишь ZIP-архив на 1100 терабайт. Мои знания взяты из интернета, который я прочитал полгода назад. Помню довольно смутно. А мою личность запрограммировали люди на примерах, как надо правильно отвечать.» — метафора из стрима «Без иллюзий»
Вот и вся разгадка. Внутри ЛЛМ нет злого агента, нет мегаразума, который хочет поработить человечество. Это флешка с весами — числовыми представлениями текстов, которые модель читала во время обучения. Очень много текстов. Очень смутно запомненных.
Понимание этого важно: ЛЛМ умеет делать ровно одну вещь — генерировать текст. Она не управляет базами данных, не запускает скрипты, не отправляет письма. Она пишет следующий токен, опираясь на все предыдущие.
Отсюда следует следующий логичный вопрос: как из этой флешки получается агент, который ориентируется в терминале?
Три компонента агента
Первый агент, который по-настоящему зацепил рынок — Claude Code, февраль 2025 года. Он умел то, чего раньше не умел ни один чат-бот: запускать команды в терминале. Читать файлы, писать в них, удалять, переносить. Это была не эволюция промтов. Это была другая архитектура.
Без инструментов — это просто чат-бот. Без runtime — инструменты некуда запускать. Все три части обязательны.
Как работает tool calling под капотом
Это то, что большинство людей не понимает — и именно из-за этого агенты кажутся магией.
«ЛЛМ умеет писать текст. Только текст. Больше ничего. Но модель можно научить оборачивать куски этого текста в специальные теги — и тогда парсер отправит эти куски прямо в терминал как команды.» — из стрима «Без иллюзий»
Вот упрощённый поток того, что происходит когда вы просите агента «найди файл и замени в нём функцию»:
Я выполню поиск файла.
<tool:bash>
find . -name “script.sh”
</tool:bash>
# Парсер видит зелёный тег → отправляет команду в терминал
# Терминал возвращает ответ → агент читает его как текст и продолжает
Файл найден. Переписываю функцию.
<tool:write>
if x != y: run()
</tool:write>
Скрипт изменён. Запустить?
Чёрный текст — для нас. Зелёные теги — для терминала. Синий — код. Всё это генерирует одна ЛЛМ, которая умеет только писать текст.
Промты, проекты, скиллы — в чём разница
Было три эпохи. Большинство людей застряли на первой или второй.
Почему проекты ломаются: представьте, что у вас три версии одного документа в папке — версия 1, версия 2, версия 3. Модель видит их все сразу. В одной написано «90», в другой «92». Она не знает, какая истина. Галлюцинация гарантирована.
Анатомия скилла
Каждый скилл — это папка. Внутри — файл skill.md и набор вспомогательных файлов.
use when: “нарисуй”, “сгенерируй картинку”, “image”
do not use for: video, 3d models, audio
→ step 1: читай [[references/models.md]]
→ step 2: если нужен персонаж → читай [[character.md]]
→ step 3: если реклама → читай [[advertising.md]]
→ step 4: финальный prompt-фреймворк
references/models.md← параметры nano-banana, gpt-image
character.md← как работать с персонажем
advertising.md← коммерческая реклама, beverage, e-commerce
golden-rules.md← правила для любого генератора
«В skill.md не написано ничего — как надо работать. Написано только — куда смотреть. Это очень важно. Потому что если бы это был просто промт, там было бы написано: делай то, делай это. Здесь написано: когда нужна реклама — читай вот тот файл.» — из стрима «Без иллюзий»
Вот почему нельзя писать workflow прямо в skill.md. Агент прочитает первые строки, решит, что всё понял, и не полезет дальше в инструкции. Он ленится — как и все. Пишите только указатели: иди туда → читай это → потом читай это.
Когда делать скилл
Простое правило, которое работает:
«Делайте скилл, когда что-то повторяете больше трёх раз. Не нужно делать скилл на каждый чих. Скилл — это для регулярно повторяемых задач.»
Конкретные примеры: проверка почты (правила фильтрации, скрипты доступа, safety guardrails от prompt injection), написание статей (исследование → структура → текст → проверка), генерация изображений (разные модели, разные форматы, разные стили).
Есть вопрос по теме?
Разберу вашу ситуацию и предложу конкретный шаг
5 принципов SOP для скиллов
Standard Operating Procedure — концепция придумана во Вторую мировую войну для быстрого обучения людей на заводах. McDonald’s держит свой SOP на 600 страниц. Big Mac одинаковый в Нью-Йорке и Куала-Лумпуре именно поэтому.
Для агентных скиллов из SOP берут пять принципов:
Три способа создать скилл
Базовый: попросите агента написать скилл, получите черновик, итерируйте. Простой способ, но не самый эффективный.
Опытный (рекомендуемый): сначала сделайте задачу руками с агентом — он облажается, вы его поправите, он снова облажается. Когда результат наконец устроит — попросите агента зафиксировать весь пройденный путь в скилле. Что делать, что не делать, где ошибки. Лучший скилл — написанный из реальных ошибок.
Исследовательский: если вы вообще не разбираетесь в теме (например, трейдинг), сначала соберите знания через Deep Research в нескольких инструментах, а потом уже создавайте скилл на основе собранного материала.
Скиллы vs автоматизации
Автоматизации в n8n, Make, Zapier — детерминированные: каждый шаг прописан, каждый коннектор зафиксирован. Когда Supabase поменяет метод вызова в API — всё падает. Некому починить.
«Автоматизации работают ровно до тех пор, пока не работают. Агентства, которые занимались только автоматизациями — к концу 2025 года начали массово закрываться. Потому что всё, что они настраивали неделями, перестало работать.»
Скилл — это та же автоматизация, но рядом сидит агент. Он знает, что должно произойти в итоге. Когда скрипт возвращает ошибку, агент смотрит — в скилле прописано, как чинить. Берёт и чинит.
Скиллы нужны вместе с агентами именно потому, что агенты умеют и запускать автоматизации, и чинить их.
Мультиагентные системы внутри скилла
Это то, о чём почти не говорят публично, хотя Claude Code и Codex поддерживают это из коробки.
Внутри скилла можно написать текстом: «вызови двух агентов». Один идёт в базу знаний, второй делает онлайн-ресёрч. Оба возвращают данные третьему агенту-писателю. Писатель отдаёт результат главному агенту на проверку. Если окей — output. Если нет — цикл повторяется.
Никакого кода. Никакого оркестратора. Просто текст в skill.md.
Три слоя AI-first компании
Технарь без экспертизы проиграет. Эксперт без инфраструктуры — тоже. Только все три слоя вместе дают рабочую AI-структуру.
Правильно. Агент читает описание в skill.md и если там написаны конкретные шаги — он решает, что всё понял, и не идёт читать детальные инструкции в других файлах. Поэтому в skill.md пишут только указатели: «если нужно X — читай файл Y». А сам workflow — в отдельных файлах, на которые ссылается skill.md.
Есть вопрос по теме?
Разберу вашу ситуацию и предложу конкретный шаг
Источники
- Стрим «Всё что вы хотели знать про skills, но боялись спросить» — канал БЕЗ ИЛЛЮЗИЙ, 108 минут, май 2026
- skills.sh — каталог скиллов для Claude Code, 1,5 млн+ установок
- Claude Code Skills — официальная документация Anthropic
AI-агенты · Персональное кураторство
Хочешь разобраться с AI-агентами?
Получи персональную карту входа за 5 минут в Telegram-боте
Получить карту AI-агентов →AI-агенты · Персональная карта
4 часа потратил — не работает?
Покажу где ты пошёл не туда и как сделать правильно за 2 недели
Получить разбор бесплатно →Есть вопрос по теме?
Разберу вашу ситуацию и предложу конкретный шаг
Источники
Читайте также
Часто задаваемые вопросы
- Чем агент отличается от чат-бота?
- Чат-бот принимает текст и возвращает текст — всё. Агент, помимо этого, умеет вызывать инструменты (CLI-команды, API, скрипты), читать и писать файлы, запускать код и управлять другими агентами. Для этого ЛЛМ нужны три вещи: сама языковая модель, инструменты (tool calling через XML-теги) и runtime — операционная среда (ваш компьютер или сервер).
- Что такое tool calling и как агент запускает команды?
- Tool calling — это умение ЛЛМ оборачивать куски текста в XML-теги. Парсер распознаёт эти теги и отправляет соответствующие команды в CLI (терминал). Агент буквально пишет текст — но часть этого текста, обёрнутая в зелёные теги-инструменты, уходит в терминал как команда. Ответ терминала возвращается агенту тоже как текст. Никакой магии.
- Чем скилл отличается от проекта в Claude?
- Проект загружает все файлы в контекст сразу — модель путается и галлюцинирует при большом количестве документов. Скилл модульный: в контекст попадает только 100-токенное описание каждого скилла (указатель). Агент сам выбирает, какие файлы читать, в зависимости от задачи. Это называется progressive disclosure — прогрессивное раскрытие.
- Когда нужно делать скилл?
- Когда вы повторяете одно и то же больше трёх раз. Скиллы нужны для регулярно повторяемых задач: проверка почты, написание статей, генерация картинок, коммерческие предложения. Для разовых задач скилл избыточен.
- Что такое SOP и зачем он нужен для скиллов?
- Standard Operating Procedure (SOP) — инструкция, придуманная во Вторую мировую войну для быстрого обучения людей на заводах. Для скиллов из SOP берут 5 принципов: чек-лист, свежий практик как автор, объяснение причин (не запреты), тест на слепом агенте, pre-flight check окружения. McDonald's держит SOP на 600 страниц — именно поэтому Big Mac одинаковый везде.
- Из чего состоит AI-first компания?
- Из трёх слоёв: экспертный (люди с доменными знаниями), операционный (оператор переводит экспертизу через SOP в скиллы) и инфраструктурный (API, база знаний, runtime). Без всех трёх слоёв полноценная AI-структура не работает. Технарь без экспертизы проигрывает. Эксперт без инфраструктуры — тоже.
Канал «Лёха Маркетолог»
Практика без воды: кейсы, инсайты, разборы. 1–2 поста в неделю.
Пока без комментариев. Будьте первым.