Google выпустила Gemini Embedding 2 — первую полностью мультимодальную модель эмбеддингов. Она отображает текст, изображения, видео, аудио и документы в единое векторное пространство. Для команд, которые строят продуктовый поиск, рекомендации или автоматизацию контента, это меняет архитектурные решения прямо сейчас.
Что произошло
Google выпустила модель с поддержкой 100+ языков. Технические параметры (по данным компании): текст до 8 192 токенов, до 6 изображений за запрос, видео до 120 секунд, нативные аудио-эмбеддинги, PDF до 6 страниц.
Внутри — технология Matryoshka Representation Learning. Размер вектора можно сжимать: 3 072 → 1 536 → 768 измерений. Качество падает контролируемо. Затраты на хранение — управляемо.
Почему это бьёт по деньгам и маркетингу
- Стоимость хранения векторов (прямое влияние на операционные расходы) — сжатие вдвое сокращает объём векторной базы данных. При миллионах объектов это снижает ежемесячные расходы на инфраструктуру на 30–50%. Точных цифр Google не публикует — оценка косвенная.
- CAC (стоимость привлечения клиента) в продуктах с поиском — единое векторное пространство убирает необходимость отдельных моделей для текста и изображений. Разработка одного поискового пайплайна взамен трёх снижает время до запуска и бюджет команды.
- LTV (пожизненная ценность клиента) через качество рекомендаций — мультимодальный поиск точнее матчит запрос пользователя с каталогом. В е-коммерсе это напрямую влияет на конверсию и повторные покупки. Но каждый конкретный прирост зависит от ниши и текущей базы.
Как использовать это в ближайшие 30 дней
- Аудит текущей поисковой и рекомендательной инфраструктуры — зафиксируй, сколько отдельных моделей обслуживают текст, изображения, каталог. Метрика: список узких мест с оценкой стоимости поддержки каждого контура.
- Пилот на задаче с наибольшим CAC — выбери один сценарий: семантический поиск по каталогу, кластеризация отзывов или анализ тональности. Запусти тест через Gemini Embedding 2 API. Метрика: точность поиска (precision@10) до и после.
- Пересчёт стоимости хранения при сжатии векторов — сравни текущий объём векторной базы с вариантом 768 измерений. Метрика: дельта стоимости хранения за месяц в рублях или долларах.
Вывод
Технология рабочая, доступна через API уже сейчас. Если у тебя в продукте есть поиск, рекомендации или работа с мультимедийным контентом — изучай и тестируй. Если инфраструктуры нет совсем — подожди: рынок даст готовые решения поверх этой модели через 3–6 месяцев.
Пока без комментариев. Будьте первым.