Разбор
ИИ-суфлёр в WhatsApp: как отвечать клиентам за 30 секунд вместо 3 часов
Строительная компания сократила время первого ответа с 3 часов до 4 минут — и конверсия лидов выросла на 28%. Детальный кейс: WhatsApp Business API + Claude API, полный код на Python, два режима работы и готовый system prompt.
Пятница, 16:47. Клиент пишет в WhatsApp: «Сколько стоит облицовка фасада 200 м²?» Менеджер видит сообщение в понедельник утром — и отвечает. Клиент к тому моменту уже заключил договор с конкурентом, который ответил в тот же день через 6 минут.
Это не история про “будущее ИИ”. Это история про то, что прямо сейчас конкуренты забирают твои сделки — пока твой менеджер допивает кофе.
Почему 3 часа — это провал, а не нормально
Есть исследование InsideSales.com, которое обычно приводят на конференциях и сразу забывают. Смысл там простой: вероятность квалификации лида падает в 21 раз, если ответить через 30 минут вместо 5. В 21 раз — не на 21 процент.
В B2C WhatsApp-продажах это работает ещё жёстче. Человек написал — значит, он сейчас горячий. Через час он либо ушёл к конкуренту, либо переключился на что-то другое и остыл. Средний отдел продаж отвечает за 2–4 часа. Конкуренты, которые внедрили автоматизацию — за 3–10 минут.
Обычный ответ на это: «Наймём ещё менеджера». Считаем: зарплата 60–80 тысяч рублей, налоги, больничные, текучка. И всё равно человек не может отвечать моментально — у него обед, звонки, документы.
Второй ответ: «Поставим чат-бота». Поставили. Клиент получил «Здравствуйте! Выберите раздел: 1 — Услуги, 2 — Цены, 3 — Контакты» — и закрыл чат.
Есть третий путь.
Суфлёр, а не автомат
Идея простая. Когда клиент пишет в WhatsApp, система за 3–5 секунд:
- Анализирует сообщение
- Классифицирует запрос (цена, сроки, технический вопрос, жалоба)
- Генерирует готовый черновик ответа
Менеджер видит уведомление с черновиком прямо в интерфейсе. Нажимает «Отправить» или быстро правит. Клиент получает ответ через 30–90 секунд — и это ответ от живого менеджера, не от бота.
Для FAQ (цены, адрес, сроки, стандартные условия) можно включить полностью автоматический режим — ИИ отвечает сам, менеджер видит копию в ленте. Для сложных запросов — всегда через одобрение человека.
Что спрашивают клиенты — и кто отвечает
Прежде чем писать код, надо решить главный вопрос: какие сообщения отдать ИИ полностью, а какие — только с черновиком?
| Тип запроса | Примеры | Режим |
|---|---|---|
| Цены и прайс | «Сколько стоит?», «Пришлите прайс», «Цена за м²» | Авто |
| Адрес и режим работы | «Где находитесь?», «До скольки работаете?» | Авто |
| Сроки исполнения | «Как быстро сделаете?», «Когда можете начать?» | Авто |
| Портфолио и примеры | «Покажите примеры работ», «Есть ли кейсы?» | Суфлёр |
| Замер и расчёт | «Нужен замерщик», «Рассчитайте стоимость» | Суфлёр |
| Рекламации и жалобы | «Недоволен результатом», «Есть претензия» | Человек |
| Крупные переговоры | «Нужно 5 000 м² для ЖК», «Обсудим договор» | Человек |
Эту классификацию делает сам ИИ — менеджер не думает, к какому типу отнести каждое сообщение.
Как это работает технически
Стек минимальный: Python + FastAPI + Green API + Claude API. Всё разворачивается на VPS за 30–40 минут.
Шаг 1. Настройка webhook в Green API
Создаёшь инстанс в личном кабинете Green API, привязываешь номер WhatsApp Business, указываешь URL вебхука — куда Green API будет отправлять входящие сообщения.
<span class="wa-code__keyword">import</span> requests
<span class="wa-code__comment"># Настройка вебхука через API Green API</span>
INSTANCE_ID = <span class="wa-code__string">"your_instance_id"</span>
API_TOKEN = <span class="wa-code__string">"your_api_token"</span>
<span class="wa-code__func">def</span> set_webhook(webhook_url):
url = f<span class="wa-code__string">"https://api.green-api.com/waInstance{INSTANCE_ID}/setSettings/{API_TOKEN}"</span>
payload = {
<span class="wa-code__string">"webhookUrl"</span>: webhook_url,
<span class="wa-code__string">"webhookUrlToken"</span>: <span class="wa-code__string">"your_secret_token"</span>,
<span class="wa-code__string">"incomingWebhook"</span>: <span class="wa-code__string">"yes"</span>
}
<span class="wa-code__keyword">return</span> requests.<span class="wa-code__func">post</span>(url, json=payload)
<span class="wa-code__comment"># При разработке — ngrok даёт публичный HTTPS-URL</span>
<span class="wa-code__comment"># ngrok http 8000 → https://xxxxx.ngrok.io</span>Шаг 2. FastAPI сервер — приём сообщений и вызов Claude
<span class="wa-code__keyword">from</span> fastapi <span class="wa-code__keyword">import</span> FastAPI, Request
<span class="wa-code__keyword">import</span> anthropic, requests, json
app = FastAPI()
claude = anthropic.<span class="wa-code__func">Anthropic</span>()
SYSTEM_PROMPT = <span class="wa-code__string">"""
Ты — ассистент отдела продаж строительной компании "СтройПрофи".
Компания занимается фасадными работами в Москве и МО.
ПРАЙС:
- Облицовка кирпичом: от 3 200 руб/м²
- Штукатурка фасада: от 1 800 руб/м²
- Утепление + штукатурка: от 2 400 руб/м²
- Замер бесплатный, выезд в день обращения
СРОКИ: фасад 200 м² — 14–21 рабочий день
РЕЖИМ РАБОТЫ: Пн-Пт 8:00-20:00, Сб 9:00-17:00
ЗАДАЧА: Определи тип запроса и верни JSON:
{
"type": "faq"|"semi"|"human",
"draft": "текст ответа клиенту",
"reason": "почему такой тип"
}
FAQ = типовые вопросы по прайсу, срокам, адресу.
Semi = расчёт, замер, портфолио.
Human = жалобы, крупные объекты >500 м², юридические вопросы.
"""</span>
<span class="wa-code__func">@app.post</span>(<span class="wa-code__string">"/webhook"</span>)
<span class="wa-code__keyword">async def</span> <span class="wa-code__func">handle_webhook</span>(request: Request):
data = <span class="wa-code__keyword">await</span> request.<span class="wa-code__func">json</span>()
<span class="wa-code__comment"># Извлекаем текст входящего сообщения</span>
msg_type = data.<span class="wa-code__func">get</span>(<span class="wa-code__string">"typeWebhook"</span>)
<span class="wa-code__keyword">if</span> msg_type != <span class="wa-code__string">"incomingMessageReceived"</span>:
<span class="wa-code__keyword">return</span> {<span class="wa-code__string">"ok"</span>: True}
msg_data = data[<span class="wa-code__string">"messageData"</span>]
<span class="wa-code__keyword">if</span> msg_data[<span class="wa-code__string">"typeMessage"</span>] != <span class="wa-code__string">"textMessage"</span>:
<span class="wa-code__keyword">return</span> {<span class="wa-code__string">"ok"</span>: True}
text = msg_data[<span class="wa-code__string">"textMessageData"</span>][<span class="wa-code__string">"textMessage"</span>]
chat_id = data[<span class="wa-code__string">"senderData"</span>][<span class="wa-code__string">"chatId"</span>]
<span class="wa-code__comment"># Вызываем Claude для анализа и генерации ответа</span>
response = claude.messages.<span class="wa-code__func">create</span>(
model=<span class="wa-code__string">"claude-sonnet-4-6"</span>,
max_tokens=512,
system=SYSTEM_PROMPT,
messages=[{<span class="wa-code__string">"role"</span>: <span class="wa-code__string">"user"</span>, <span class="wa-code__string">"content"</span>: text}]
)
result = json.<span class="wa-code__func">loads</span>(response.content[0].text)
<span class="wa-code__keyword">if</span> result[<span class="wa-code__string">"type"</span>] == <span class="wa-code__string">"faq"</span>:
<span class="wa-code__comment"># Автоответ: отправляем напрямую клиенту</span>
<span class="wa-code__func">send_message</span>(chat_id, result[<span class="wa-code__string">"draft"</span>])
<span class="wa-code__keyword">else</span>:
<span class="wa-code__comment"># Суфлёр: отправляем черновик менеджеру в Telegram</span>
<span class="wa-code__func">notify_manager</span>(chat_id, text, result[<span class="wa-code__string">"draft"</span>], result[<span class="wa-code__string">"type"</span>])
<span class="wa-code__keyword">return</span> {<span class="wa-code__string">"ok"</span>: True}Шаг 3. Уведомление менеджера с черновиком
Менеджер получает в Telegram сообщение вида:
📨 Новый запрос WhatsApp
От: +7 999 123-45-67
Тип: расчёт/замер
Клиент написал:
"Нужна облицовка кирпичом, у меня коттедж 280 м² в Подольске"
💬 Черновик ответа:
"Здравствуйте! Фасадная облицовка кирпичом — от 3 200 руб/м².
Для вашего объёма 280 м² предварительная сумма: от 896 000 руб.
Замерщик бесплатно выедет сегодня или завтра. Удобно в какое время?"
[Отправить] [Редактировать] [Передать коллеге]
Менеджер нажимает одну кнопку — и ответ уходит клиенту от его имени. Весь процесс занимает 15–20 секунд против 10–15 минут ручного набора.
Есть вопрос по теме?
Разберу вашу посадочную страницу и укажу где теряются клиенты
Как обучить ИИ под свой бизнес
System prompt — это сердце всей системы. Плохой промпт даёт галлюцинации, хороший — делает ИИ точнее любого скрипта продаж.
Что обязательно класть в system prompt:
Прайс с условиями. Не просто цифры, а контекст: от чего зависит цена, что включено, что нет. ИИ должен уметь посчитать предварительную сумму по запросу клиента.
Скрипты возражений. «Дорого» → что отвечать. «Подумаю» → как удерживать. «У конкурентов дешевле» → чем аргументировать. Это не абстрактные советы, а конкретные фразы, которые работали у твоих лучших менеджеров.
Граница компетенции. Чётко прописать: в каких ситуациях ИИ говорит «дайте уточню у специалиста» вместо того чтобы придумывать ответ. Лучше честное «не знаю» чем уверенная неправда.
Примеры диалогов. 5–10 реальных переписок с хорошим результатом. Claude учится на паттернах — покажи ему как выглядит идеальный разговор.
Оптимальный объём system prompt: 1 500–3 000 токенов. Больше — Claude начинает путаться в приоритетах. Меньше — слишком много оставляет на своё усмотрение. Обновлять при каждом изменении прайса, условий или появлении новых типичных возражений.
Реальные числа из кейса
Строительная компания в Москве, 6 менеджеров, 80–120 входящих сообщений WhatsApp в день. До внедрения.
42% входящих — это типовые вопросы по прайсу, адресу и срокам. Менеджеры на них больше не тратят время вообще. Остальные 58% получают черновик, который надо только проверить.
Окупаемость вышла за 6 недель. При среднем чеке 850 000 рублей — достаточно было 2 дополнительных сделки в месяц, чтобы покрыть все расходы на инфраструктуру на год вперёд.
Квиз: насколько быстро отвечает твой отдел продаж
Диагностика скорости ответа
4 вопроса — найдёшь где теряются деньги
Подводные камни, которые никто не упоминает
Первые две недели будут тяжелее, чем кажется. ИИ иногда ошибается в классификации, а менеджеры поначалу не доверяют черновикам и переписывают их полностью — что примерно равно работе без суфлёра.
Три вещи, без которых система не работает.
Один: system prompt надо переписывать каждые 2–3 недели, пока не устаканится. Первая версия будет плохой. Это нормально — собирай реальные диалоги, добавляй их как примеры.
Два: нужен один человек, ответственный за качество ответов ИИ. Не «все следят», а конкретный человек с метрикой «процент черновиков, отправленных без изменений». Когда этот процент растёт — система работает. Когда падает — надо разбираться почему.
Три: автоматический режим для FAQ надо вводить постепенно. Начни с одной категории (например, только «сколько стоит»), посмотри результат две недели, потом расширяй.
Ещё одна вещь, которую часто игнорируют: клиент не должен знать, что с ним говорил ИИ. Тон ответов должен совпадать с манерой конкретного менеджера, не быть одинаково «правильным» для всех. Хороший system prompt это учитывает.
WhatsApp-продажи в России — это уже не «попробовать», а основной канал для большинства B2C-компаний. Компании, которые отвечают быстро, забирают рынок у тех, кто отвечает правильно. Скорость сейчас важнее идеального текста.
Есть вопрос по теме?
Разберу вашу ситуацию и предложу конкретный шаг
Похожие кейсы
- Квалификация лидов в AmoCRM через ИИ
- Коммерческое предложение за 10 минут
- Транскрибация звонков и разбор в CRM
- FAQ-бот для сайта без галлюцинаций
Источники
AI-агенты · Персональная карта
4 часа потратил — не работает?
Покажу где ты пошёл не туда и как сделать правильно за 2 недели
Получить разбор бесплатно →AI-агенты · 10 мест
Ты работаешь до полуночи — AI-агент будет работать вместо тебя
Покажу какой агент закроет твою главную операционную боль
Узнать свой маршрут →Есть вопрос по теме?
Разберу вашу ситуацию и предложу конкретный шаг
Источники
Читайте также
Часто задаваемые вопросы
- Что такое ИИ-суфлёр для WhatsApp и чем он отличается от чат-бота?
- Чат-бот отвечает клиенту сам — без участия менеджера. ИИ-суфлёр работает иначе: он анализирует входящее сообщение и за 3–5 секунд генерирует готовый черновик ответа, который видит менеджер. Тот может нажать 'отправить' или подправить. Клиент всегда общается с человеком, но менеджер тратит 20 секунд вместо 15 минут на каждое сообщение.
- Как подключить ИИ к WhatsApp Business в России в 2026 году?
- Через партнёров WhatsApp Business API. Два рабочих варианта для РФ: Green API (greenapi.com) — дешевле, простая интеграция через webhook, тарифы от 900 руб/мес; Wazzup (wazzup24.com) — дороже, но с готовым CRM-интерфейсом и командой поддержки. Официальное подключение через Meta недоступно для большинства российских компаний.
- Сколько стоит построить ИИ-ассистента для WhatsApp?
- Минимальная связка: Green API (от 900 руб/мес) + Claude API (от 0.003$ за 1000 токенов, при среднем диалоге ~500 токенов — около 5–7 тыс. руб/мес при 100 диалогах в день) + VPS для сервера (500–1000 руб/мес). Итого от 7 000 до 15 000 руб/мес — против зарплаты дополнительного менеджера от 60 000 руб/мес.
- Можно ли ИИ-ассистенту доверить полностью автоматические ответы?
- Для типовых FAQ — да. Цены, адрес, режим работы, статус заявки — на это ИИ отвечает надёжно, если system prompt написан правильно. Для переговоров, нестандартных ситуаций или крупных сделок — только полуавтоматический режим с одобрением менеджера. Хорошая архитектура разделяет входящие: FAQ идёт в автомат, сложные запросы — к человеку с готовым черновиком.
- Как обучить ИИ под свой бизнес?
- Через system prompt. Туда кладут: каталог товаров/услуг с ценами, условия доставки и оплаты, скрипты возражений, примеры удачных диалогов, запрещённые темы. Чем точнее system prompt — тем меньше галлюцинаций. Оптимальный объём: 1500–3000 токенов. Обновлять при каждом изменении прайса или условий.
- За какой срок окупается внедрение ИИ-суфлёра для WhatsApp?
- В кейсе строительной компании — 6 недель. Конверсия лидов выросла с 11% до 14% (+28%), время первого ответа упало с 3 часов до 4 минут. При среднем чеке сделки 850 000 руб. даже 2–3 дополнительные сделки в месяц перекрывают стоимость всего стека на год вперёд.
Канал «Лёха Маркетолог»
Практика без воды: кейсы, инсайты, разборы. 1–2 поста в неделю.
Пока без комментариев. Будьте первым.