Разбор

Голос ИИ: как машины научились говорить — и почему это опасно

Гонконг, 2024: мошенники украли $25 млн через фейковое совещание с ИИ-двойниками. 15 секунд — и ElevenLabs клонирует ваш голос. Эпизод 15 курса: возможности голосового ИИ и как защитить семью.

• 3 мин чтения

Гонконг, февраль 2024. Финансовый сотрудник получает приглашение на видеосовещание. Финдиректор, главный бухгалтер, двое коллег — все на экране, все в своих кабинетах, все говорят знакомыми голосами. Двадцать минут. Срочный перевод средств.

Реальный случай · Гонконг, февраль 2024
Через два дня выяснилось: совещания не было. Все четверо коллег — ИИ-двойники. Голоса, лица, движения, интонации — подделаны. $25 000 000 улетели мошенникам. Дело разбирала гонконгская полиция. Это крупнейшая задокументированная кража через голосовой ИИ.
15 секундаудио — столько нужно ElevenLabs чтобы выучить ваш голос. Дальше система говорит им любые слова на любом языке.ElevenLabs, 2026

Как ИИ научился говорить

Siri 2014 года — сухо, отрывисто, роботоподобно. Современные системы — ElevenLabs, OpenAI Voice, Google TTS, Yandex SpeechKit — неотличимы от живого человека. Со вздохами. С паузами. С эмоцией.

Как этого добились: кормят модель тысячами часов человеческой речи. Она учится не конкретным звукам, а структуре голоса — высоте, тембру, ритму, дыханию, микропаузам. И воспроизводит это на любом тексте.

2014
Siri — роботообразный синтез. Сложно воспринимать долго.
2019
WaveNet от Google — первый прорыв. Стало почти человекоподобно.
2022
ElevenLabs — клонирование голоса за несколько минут аудио. Тембр, эмоция, акцент.
2024
Клон за 15 секунд аудио. Дубляж сериалов голосами оригинальных актёров — стандарт.
2026
Реальное время, любой язык, неотличимо от человека. Голосовая аутентификация в банках умирает.

Где это уже работает для тебя

📚
Аудиокниги
Озвучка книги: было 2–3 месяца, стало 2 часа. Цена упала в 100 раз. Вся индустрия переехала на ИИ за полтора года.
🎬
Дубляж
Сериалы дублируют на 10 языков ИИ-голосами оригинальных актёров. Тембр, эмоция, артикуляция губ через видео-ИИ.
📢
Реклама
Без диктора и студии — за минуту по промпту. Клиентка делает за месяц роликов столько, сколько раньше за год. Результат ×3.
📝
Расшифровка
Совещание, лекция, звонок → текст за минуты. Точность 95–98%. Клиенты перестали вести рукописные заметки.
🎤
Голосовые заметки
Идёшь по улице — диктуешь в ChatGPT Voice. Он расшифровывает и выдаёт структурированный текст. Бизнес-планы на пробежке.
🌍
Языки
ChatGPT Voice как терпеливый собеседник. Не осуждает акцент, не смеётся. Клиентка преодолела страх английского за 2 недели.

Как защититься от голосового мошенничества

Голосовые звонки с просьбой денег — эпидемия. По статистике российских банков, в 2025 году каждое третье мошенничество — голосовая подделка.

Схема: берут 30 секунд из публичных видео ребёнка/внука, обучают модель за пять минут, звонят родителям со «знакомым голосом» в панике.

1
Кодовое слово в семье — сделайте сегодня
Придумайте глупое, неочевидное слово — «ананас», «полтергейст», любое. При любом звонке с просьбой денег — сначала кодовое слово. Нет слова — кладёте трубку, сами перезваниваете. Один клиент так сохранил маме 70 тысяч рублей.
2
Паника = красный флаг
Главный признак развода: эмоции, срочность, невозможность подумать. Если так — кладите трубку. Дышите. Перезвоните сами на знакомый номер через 10 минут.
3
Не публикуйте голоса детей открыто
Каждое голосовое сообщение в публичных соцсетях — материал для клонирования. 15 секунд достаточно.
4
В бизнесе — только текстовое подтверждение
Никаких «перевод подтверждаю голосом». Любое распоряжение о деньгах — только через защищённый текстовый канал. Уроки из Гонконга.
Тебе звонит «ребёнок» — голос один в один — и говорит: «попал в ДТП, срочно нужны деньги». Что делать?
← Предыдущая
Как ИИ видит мир
Эпизод 15 из 30ИИ-агенты от нуля
Следующая →
ИИ в маркетинге

Источники

Источники

Часто задаваемые вопросы

Можно ли отличить ИИ-голос от человеческого?
Уже практически нет. Современные системы (ElevenLabs, OpenAI Voice, Google TTS) воспроизводят вздохи, паузы, микроинтонации. В 2024 году мошенники провели видеосовещание с четырьмя ИИ-двойниками и украли $25 млн — сотрудник не заподозрил ничего за 20 минут разговора.
Как клонировать голос через ИИ?
ElevenLabs в 2026 году обучается на 15 секундах аудио. Загрузил короткую запись — система говорит этим голосом любые слова на любом языке. Голоса берут из публичных видео в соцсетях. Именно поэтому не стоит публиковать голосовые сообщения в открытом доступе.
Как защитить родителей от голосового мошенничества?
Три меры: 1) Придумайте семейное кодовое слово — при звонке с просьбой о деньгах спрашивайте его. 2) Никаких финансовых решений по телефону, если звонящий создаёт ощущение паники и срочности. 3) Сами перезванивайте на знакомый номер — не отвечайте на входящий.
Как использовать голосовой ИИ для обучения языкам?
ChatGPT Voice и Gemini Live позволяют разговаривать как с живым собеседником. Они терпеливо ждут, мягко поправляют и не осуждают акцент. Один клиент преодолел страх английского за две недели разговора с ChatGPT Voice — по 10 минут в день.
Для чего можно использовать расшифровку речи в работе?
Превращать совещания и звонки в текст (Whisper, Otter.ai), диктовать идеи на ходу, обрабатывать голосовые заметки через ИИ. Один клиент наговаривает бизнес-планы на утренних пробежках — дома находит готовую структурированную стратегию.
Как ИИ используется для озвучки и аудиокниг?
Озвучка книги раньше занимала 2–3 месяца (актёр, студия, монтаж). Сейчас — 2 часа. Цена упала в 100 раз. Дубляж сериалов на 10 языков ИИ-голосами оригинальных актёров — уже стандарт. Рекламные ролики без диктора и студии — за минуту по промпту.
Обсуждение

    Пока без комментариев. Будьте первым.

    Войдите, чтобы отправить комментарий

    Вы сможете комментировать статьи, сохранять материалы

    или войдите по email

    Бесплатная диагностика · 30 минут · без обязательств

    Маркетинг работает, но продажи не растут?

    Отвечу на 3–5 вопросов о вашем бизнесе — и мы вместе разберём, где именно теряются клиенты и что с этим делать.

    Без продаж. Без навязчивых звонков.