Бизнес-кейсы
Как компании используют AI для роста.
Как Сбер за два года перевёл 60% контакт-центра на GigaChat
За первый год работы AI-ассистент обработал 47 миллионов обращений автоматически — это 60% входящего потока. Среднее время ответа упало до 15 секунд (с восьми минут). Operating expenses на контакт-центр сократились на $120 миллионов в годовом исчислении. NPS среди клиентов, чьи запросы решены AI без переключения, — 71 (выше, чем у тех, кто говорил с оператором: 64). Самое неожиданное: текучка операторов сократилась с 40% до 19% — те, кто остался, занимаются интересными сложными кейсами, а не однотипным «сколько у меня на счёте». Главный риск, который пришлось закрыть — галлюцинации модели в финансовом контексте. После пилотного запуска в Самарской области в феврале 2024 был случай, когда модель уверенно назвала клиенту неверную ставку по вкладу. После этого ввели жёсткое правило: любая цифра, влияющая на финансовое решение клиента, идёт строго через function call в систему-источник, не через генерацию.
Wildberries: как ML-прогноз спроса сэкономил 12 млрд рублей на возвратах
Точность прогноза 7-дневного спроса выросла с 68% до 91% (MAPE). На категории «электроника» — с 54% до 89%. Возвраты упали на 23% — клиенты получают то, что заказали, потому что товар есть в наличии, и доставка занимает 1.4 дня вместо 3.7. Оборачиваемость склада улучшилась на 35%: оборотный капитал в неликвиде с 23 млрд упал до 14 млрд рублей. Прямая экономия — 12 миллиардов рублей в год: 7.3 млрд на сокращении логистики возвратов + 4.7 млрд на освобождённом капитале. Дополнительный эффект: GMV вырос на 4.1% от чисто доступности (когда товар есть в наличии, конверсия выше). Опыт работы с моделью научил команду WB одной вещи: feature engineering важнее архитектуры. Тот же CatBoost с правильными признаками обыграл custom transformer на 12 п.п. точности.
Алиса в умном доме: 41 миллион устройств и переход на on-device-моделей
Latency для команд умного дома упала с 1.8 с до 240 мс — 7.5× ускорение. CSAT по умному дому вырос с 6.8 до 9.1 (по 10-балльной шкале). 99.7% запросов умного дома обрабатываются локально — стоимость на распознавание упала на 91%. Это $1.15M/мес экономии только на STT, плюс ещё столько же на NLU. Неожиданный эффект — рост engagement. Пользователи стали использовать голосовое управление в 2.3× чаще, потому что «больше не ждёшь». Активный голосовой пользователь приносит платформе на 3 700 рублей в год больше (через подписку и плюс-сервисы), чем тач-пользователь. Ключевая проблема, которую пришлось решить — обновления моделей. У 12 миллионов устройств разные версии прошивки. Команда сделала differential updates: новые модели катятся через сегменты пользователей с rollback при p95-latency регрессии, среднее обновление — 48 MB, через WiFi за 90 секунд.
T-Bank: как граф-нейросеть остановила мошенничество на ₽4.2 млрд в год
Прямой ущерб от мошенничества снизился на ₽4.2 миллиарда в год (с 6.1 до 1.9 млрд). False positive rate упал с 47% до 8% — клиенты больше не получают «ваш перевод приостановлен» когда переводят бабушке на день рождения. NPS среди клиентов, у которых был хотя бы один alert, вырос с 31 до 64. Команда антифрода сократилась с 280 до 110 человек — оставшиеся работают на сложных кейсах с LLM-объяснениями. Compensation payments клиентам упали в 2.4 раза: модель ловит атаку до того, как деньги уходят с карты, а не разбирает постфактум. Главный challenge продакшна — drift графа. Мошенники адаптируются за 2-3 недели: меняют паттерны, дрожжевые счета, способы социальной инженерии. Команда автоматизировала retraining: каждую неделю модель видит подсэмплированный пред-неделей граф + новые подтверждённые случаи фрода, и веса обновляются.
Botkin.AI: как компьютерное зрение находит рак лёгких раньше радиолога на 11 месяцев
Среднее опережение диагностики — 11 месяцев. Из 4.7 миллиона обработанных снимков система детектировала 2 380 случаев рака лёгких I стадии, которые были пропущены живыми радиологами. Из этих 2 380 — 88% прожили 5+ лет (вместо ожидаемых 6% при поздней диагностике). Это математически — 1 950 спасённых жизней. Для клиник эффект экономический: средняя стоимость лечения рака I стадии в РФ — 320 000 рублей (хирургия), IV стадии — 4.1 миллиона рублей (химиотерапия + операция + поддерживающее). Раннее обнаружение экономит системе ОМС около 8 миллиардов рублей в год по всем клиникам сети. Компания получила сертификацию ФСТЭК и регистрационное удостоверение Росздравнадзора (РУ-2024-0481). Это позволяет официально включать AI-инструмент в clinical pathway. С 2024 года 11 регионов ОМС оплачивают использование Botkin.AI по тарифу 380 рублей за скрининг — это первый случай реимбурсии медицинского AI в России.
Газпром нефть: предиктивное обслуживание буровых снизило downtime на 41%
Total downtime по парку из 1 240 установок снизился на 41%. В абсолютных значениях — 188 000 часов работы установок в год дополнительно. При среднесуточной выручке буровой 7.7 миллиона рублей это даёт +60 миллиардов рублей дополнительной добычи в год. Это самый большой ROI среди всех ML-проектов в нефтегазовом секторе РФ. Количество аварийных отказов «между планами» упало с 68 случаев в год до 9 — главные «убийцы» downtime (подшипники, насосы, верхний привод) теперь предсказываются за 200+ часов. Расход на запчасти снизился на 12% (overmaintenance уменьшился), хотя на старте проекта боялись обратного — что предиктивная замена увеличит расход. На деле — заменяют точечно и реже. Главная сложность, с которой команда столкнулась — миграция инженерной культуры. Опытные начальники установок, бурящие с 1990-х, сначала отвергали рекомендации модели. Помог формат «AI как стажёр»: молодой инженер на смене может сослаться на «AI рекомендует» как на second opinion, и это даёт ему политический cover для аргумента с начальником. Через 14 месяцев культура развернулась — теперь установка БЕЗ predictive maintenance кажется недоукомплектованной.
Ozon: как трансформер на 1.2B параметров поднял GMV на 14%
GMV вырос на 14% — это около 340 миллиардов рублей в годовом исчислении. Конверсия из главного экрана поднялась с 4.1% до 6.8%. Average order value — на 8% (модель лучше понимает, какие up-sell товары релевантны). CTR на основной ленте — рост на 31%. Для cold-start новых пользователей — самый драматичный эффект. Раньше первая покупка нового пользователя случалась в среднем через 12 дней после регистрации (на основе «общих популярных» товаров часто не находил нужное). С PRISM — 4 дня. Это в 3 раза быстрее монетизация нового пользователя. Контекстуальная модель показала интересный паттерн: «вечерние сессии» (после 21:00) дают в 1.8 раза больше конверсий на персональные подборки, чем «утренние» (до 12:00). Утром пользователи целеустремлённо ищут конкретные вещи, вечером — расслабленно листают и готовы к рекомендациям. Это поменяло маркетинговую стратегию push-уведомлений: «вечерние» подборки стали приоритетной коммуникацией.
Росатом: цифровой двойник АЭС сократил сроки ремонта реактора на 19 дней
Средняя длительность PPR сократилась с 53 дней до 34 — это 19 дней экономии. В пересчёте на 9 ремонтов 2024 года — 171 день дополнительной выработки на 38 миллиардов рублей. Утилизация специалистов выросла с 88% до 96% — те же люди делают больше работы. Количество «каскадных» задержек (когда одна операция сдвигает 5+ других) упало с 47 случаев за PPR до 6. Re-planner каждые 15 минут не даёт времени «накопить» сдвиги — они изолируются и обрабатываются локально. Дополнительный эффект: безопасность. Anomaly detector с 12-минутной реакцией предотвратил два потенциально опасных инцидента в 2024 году: бригада начала разборку одного из вспомогательных контуров, не убедившись что соседний под давлением. Сигнал ушёл в 67 секунд, площадка остановлена за 4 минуты. Без AI это могло перейти в реальное событие. Ключевая сложность реализации — культурная. Бригадиры с 30-летним опытом не любят, когда «компьютер» переставляет им порядок работ. Команда сделала важный фрейм: «компьютер не приказывает, он предлагает альтернативы, решает бригадир». Принимаемость рекомендаций выросла с 23% (первые 3 месяца) до 81% (после 14 месяцев работы).
М.Видео-Эльдорадо: компьютерное зрение в 1 080 магазинах подняло конверсию на 23%
Конверсия в сети выросла с 14% до 17.2% за первый год работы. Главный фактор — оптимизация расписания консультантов. Раньше: 3 человека на зоне стиральных машин по графику с 10:00 до 18:00. Теперь: 5 человек в часы пик (среда 17-20, суббота 13-18) и 1 в провалы (вторник 11-13). Customer waiting time снизился на 47% — посетитель, который не дождался консультанта, в 73% случаев уходит без покупки. Incident detection в режиме реал-тайма выявил три важные вещи: 14% краж — внутренние (сотрудники), что было неожиданным масштабом; 31% «потерянных» дорогих товаров (оставленных без присмотра) — это были кейсы, когда консультант увлёкся одним клиентом и забыл про второго; конфликты на кассах — 22 случая в день в среднем по сети, из них 4 эскалирующиеся (раньше учитывались только эскалирующиеся). Ключевая сложность — privacy compliance. Команда работала с Роскомнадзором 7 месяцев для согласования: face blurring на edge до того, как кадр уйдёт куда-либо, никаких прямых идентификаций, anonymous session IDs обнуляются раз в 4 часа, все «события» автоматически удаляются через 30 дней. Это всё прописано в стандарте, который теперь является референсным для всей отрасли.
Почта России: OCR + AI-роутер сократил время обработки посылки на 38%
Среднее время обработки одной посылки на сортировочном центре сократилось с 47 до 29 секунд (-38%). Точность чтения адреса выросла с 96.3% (ручной ввод) до 99.4% (OCR). Команда вручную сортирующих операторов сократилась с 8 200 до 2 300 — оставшиеся работают только на сложных случаях, которые ансамбль не смог расшифровать. Ключевая метрика — % посылок, доставленных в нормативный срок. До: 81%. После: 96%. Это вернуло доверие пользователей к госпочте: в 2024 году NPS Почты России впервые за десятилетие стал положительным (+14, было -23 в 2022). Декабрьский кризис 2024 года прошёл практически незаметно: пиковая нагрузка обработана теми же мощностями, очередей не было. Экономика проекта: инвестиции 4.7 миллиарда рублей (железо + разработка + интеграция). Прямая экономия — 8.1 миллиарда рублей в год на сокращении ручной работы. ROI окупился за 7 месяцев. Дополнительная выгода: снижение возвратов «адрес не найден» сократило логистические расходы ещё на 1.2 миллиарда рублей.