T-Bank: как граф-нейросеть остановила мошенничество на ₽4.2 млрд в год

Прямой ущерб от мошенничества снизился на ₽4.2 миллиарда в год (с 6.1 до 1.9 млрд). False positive rate упал с 47% до 8% — клиенты больше не получают «ваш перевод приостановлен» когда переводят бабушке на день рождения. NPS среди клиентов, у которых был хотя бы один alert, вырос с 31 до 64. Команда антифрода сократилась с 280 до 110 человек — оставшиеся работают на сложных кейсах с LLM-объяснениями. Compensation payments клиентам упали в 2.4 раза: модель ловит атаку до того, как деньги уходят с карты, а не разбирает постфактум. Главный challenge продакшна — drift графа. Мошенники адаптируются за 2-3 недели: меняют паттерны, дрожжевые счета, способы социальной инженерии. Команда автоматизировала retraining: каждую неделю модель видит подсэмплированный пред-неделей граф + новые подтверждённые случаи фрода, и веса обновляются.

₽4.2B

снижение ущерба/год

47%→8%

false positives

47ms

inference latency

-61%

команда антифрода

Контекст

T-Bank (бывший Тинькофф) обслуживает 41 миллион клиентов, обрабатывает 18 миллиардов транзакций в год. С 2022 года количество атак мошенников выросло в 4.1 раза: социальная инженерия через мессенджеры, поддельные банковские звонки, фишинговые SIM-карты. Главный вектор — «представитель банка»: жертва переводит деньги «на безопасный счёт». Средний чек ущерба — 87 000 рублей. До 2023 года банк компенсировал клиентам убытки в 38% случаев (по решению суда или из доброй воли), что прямо било в P&L.

Проблема

Прежний rule-based антифрод видел только саму транзакцию: сумма, получатель, время, гео. Этого хватало в 2018 году. К 2024 году мошенники научились обходить: переводят суммы под лимит, используют «дрожжевые» счета (тысячи мелких счетов для отмывания), синхронизируют атаки на сотни жертв одновременно.

Каждое срабатывание правила приходилось разбирать вручную: 12 000 алертов в день, 280 операторов антифрода, среднее время разбора — 9 минут. False-positive rate 47%: законные переводы блокировались, клиенты переходили в другие банки. NPS падал. И главное — реальные атаки шли через зазоры между правилами: мошенники писали кейсы, не покрытые ни одним правилом.

Решение

T-Bank построил graph neural network, которая видит транзакцию в контексте всей сети связей: отправитель, получатель, их историческое поведение, общие контакты, девайсы, IP-адреса, IPv6-сегменты, телефонные номера. Граф содержит 380 миллионов узлов (клиенты + контрагенты) и 14 миллиардов рёбер (транзакции, общие устройства, общие телефонные коды).

Архитектура — модифицированный GraphSAGE с inductive learning: модель работает на новых клиентах, которых раньше не видела (важно — банк регистрирует 400K новых клиентов в месяц). Inference latency — 47 мс на транзакцию (требование от платежной системы — <200 мс). Модель смотрит на 3-hop neighborhood: «друг друга мошенника» уже подсвечивается.

Ключевая инновация — temporal embedding: каждый узел графа имеет 14 «временных слоёв», по одному на каждый день недели + 7 для последних дней. Это позволяет ловить «спящих» получателей, которые активируются раз в две недели для приёма украденных денег.

Поверх GNN — second-layer LLM-классификатор для пограничных случаев: модель видит транзакцию + risk score + 5 ближайших соседей в графе и пишет explanation, почему она думает что это фрод. Это резко ускорило работу аналитиков: вместо 9 минут разбора — 90 секунд проверки готовой гипотезы.

Результат

Команда антифрода сократилась с 280 до 110 человек — оставшиеся работают на сложных кейсах с LLM-объяснениями. Compensation payments клиентам упали в 2.4 раза: модель ловит атаку до того, как деньги уходят с карты, а не разбирает постфактум.

Главный challenge продакшна — drift графа. Мошенники адаптируются за 2-3 недели: меняют паттерны, дрожжевые счета, способы социальной инженерии. Команда автоматизировала retraining: каждую неделю модель видит подсэмплированный пред-неделей граф + новые подтверждённые случаи фрода, и веса обновляются.

Технологический стек

GraphSAGE (modified)PyTorch GeometricDGLNeo4j (380M nodes)Kafka streamsONNX Runtime (CPU inference)Custom LLM (Claude Haiku for explanations)

Сроки

Прототип графа — 3 месяца. Inference в проде — ещё 7 месяцев. Полное вытеснение rule-based — 16 месяцев. Continuous retraining работает с 2024.

Команда

29 человек: ML researchers (8), graph engineers (6), MLOps (5), antifraud domain (4), backend (4), security (2)

Уроки для индустрии

Граф видит то, чего не видит транзакция. 3-hop neighborhood — sweet spot, 4-hop добавляет шум.
Temporal embedding критичен для «спящих» паттернов. Мошенники активируют счета на 2-3 минуты в две недели.
LLM-объяснение для аналитика — это не вишенка, а multiplier x6 по throughput команды.
Inductive learning важнее transductive: 400K новых клиентов в месяц — модель должна работать на тех, кого не видела при тренировке.
Retraining каждую неделю на свежих confirmed-cases — единственный способ догонять адаптацию мошенников.

← Кейсы