Росатом: цифровой двойник АЭС сократил сроки ремонта реактора на 19 дней

Средняя длительность PPR сократилась с 53 дней до 34 — это 19 дней экономии. В пересчёте на 9 ремонтов 2024 года — 171 день дополнительной выработки на 38 миллиардов рублей. Утилизация специалистов выросла с 88% до 96% — те же люди делают больше работы. Количество «каскадных» задержек (когда одна операция сдвигает 5+ других) упало с 47 случаев за PPR до 6. Re-planner каждые 15 минут не даёт времени «накопить» сдвиги — они изолируются и обрабатываются локально. Дополнительный эффект: безопасность. Anomaly detector с 12-минутной реакцией предотвратил два потенциально опасных инцидента в 2024 году: бригада начала разборку одного из вспомогательных контуров, не убедившись что соседний под давлением. Сигнал ушёл в 67 секунд, площадка остановлена за 4 минуты. Без AI это могло перейти в реальное событие. Ключевая сложность реализации — культурная. Бригадиры с 30-летним опытом не любят, когда «компьютер» переставляет им порядок работ. Команда сделала важный фрейм: «компьютер не приказывает, он предлагает альтернативы, решает бригадир». Принимаемость рекомендаций выросла с 23% (первые 3 месяца) до 81% (после 14 месяцев работы).

-19 дн

длительность PPR

₽38B

доп. выработка/год

88→96%

утилизация людей

12 мин

реакция на аномалию

Контекст

Росатом эксплуатирует 11 атомных электростанций в России с 38 энергоблоками. Каждый блок производит примерно 7 ТВт·ч электроэнергии в год — на сумму около 21 миллиарда рублей. Раз в 12-18 месяцев каждый блок останавливается на плановый ремонт и перегрузку топлива (PPR — Планово-Предупредительный Ремонт). PPR длится в среднем 53 дня. Каждый день простоя — 58 миллионов рублей упущенной выручки + затраты на компенсацию мощностей из других источников. Только в 2024 году Росатом провёл 9 PPR — это 477 дней суммарного простоя.

Проблема

Планирование PPR — оркестровка из 8 400 операций, 14 подрядных организаций, ~3 000 человек на площадке одновременно. Каждая операция имеет dependencies: ты не можешь начать разборку парогенератора до того, как уберут давление; не можешь подвести оборудование до того, как освободят проход. Раньше планирование велось в гигантском MS Project: каждый раз ремонтник лез в Excel смотреть, кто кого ждёт.

Проблема: в реальности 18% операций отставали от плана из-за непредвиденных задержек: повреждение оборудования, погодные условия, проблемы у субподрядчика, неожиданные находки при разборке (например, обнаружили коррозию там, где её не должно было быть). Каждая задержка каскадно сдвигала весь критический путь. План терял актуальность за 3-4 дня — а ремонт длится 50+.

Вторая проблема — недоиспользование персонала. В среднем 12% времени специалистов уходило на «ждать, пока освободится участок». Высококвалифицированный сварщик, которому платят 14 000 ₽ в час, просто стоял в раздевалке.

Решение

Росатом построил «цифровой двойник» каждого блока АЭС в формате living model. Это не просто 3D-визуализация (которую все ожидают, услышав «цифровой двойник»), а полная dependency graph всех 8 400 операций PPR плюс live data feed от ремонтных бригад через мобильное приложение: каждая бригада отмечает прогресс операции в реал-тайм, плюс датчики на критическом оборудовании показывают реальное физическое состояние.

Поверх digital twin работают три модели машинного обучения. Первая — re-planner: каждые 15 минут пересчитывает оптимальный план оставшихся операций с учётом текущего реального состояния. Использует mixed integer programming с ограничениями (constraint solver Google OR-Tools, custom branch-and-bound) — 8 400 переменных, 22 000 связей, решается за 8-12 минут на 96 vCPU.

Вторая модель — predictor: предсказывает риск задержки конкретной операции на основе истории (где раньше были задержки, на каком этапе) + текущих параметров (опыт бригады, состояние оборудования, доступность запчастей на складе блока). Это даёт начальникам участков «карту риска» на завтрашний день — где быть особенно внимательным.

Третья — anomaly detector: ловит «неожиданности» из data feed (например, бригада начала операцию, которая по графику не должна была начинаться) и автоматически генерирует alert в командный центр PPR. Это сократило среднее время реакции на проблему с 3 часов до 12 минут.

Результат

Количество «каскадных» задержек (когда одна операция сдвигает 5+ других) упало с 47 случаев за PPR до 6. Re-planner каждые 15 минут не даёт времени «накопить» сдвиги — они изолируются и обрабатываются локально.

Дополнительный эффект: безопасность. Anomaly detector с 12-минутной реакцией предотвратил два потенциально опасных инцидента в 2024 году: бригада начала разборку одного из вспомогательных контуров, не убедившись что соседний под давлением. Сигнал ушёл в 67 секунд, площадка остановлена за 4 минуты. Без AI это могло перейти в реальное событие.

Ключевая сложность реализации — культурная. Бригадиры с 30-летним опытом не любят, когда «компьютер» переставляет им порядок работ. Команда сделала важный фрейм: «компьютер не приказывает, он предлагает альтернативы, решает бригадир». Принимаемость рекомендаций выросла с 23% (первые 3 месяца) до 81% (после 14 месяцев работы).

Технологический стек

Google OR-Tools (CP-SAT solver)Custom MIP schedulerApache Kafka (event stream)TimescaleDBPyTorch (predictor + anomaly detector)Unity 3D (digital twin visualization)iOS/Android crew app

Сроки

Прототип на 1 блок Ленинградской АЭС — 14 месяцев. Полная digital twin модель — ещё 8 месяцев. ML-слой поверх — 6 месяцев. Раскатка на все 38 блоков — 24 месяца суммарно.

Команда

127 человек: digital twin engineers (28), ML (18), nuclear domain experts (22), backend (16), mobile (12), 3D viz (11), data engineers (10), QA (10)

Уроки для индустрии

«Цифровой двойник» это dependency graph + live data feed, а не 3D-картинка. 3D — это UI поверх.
Re-planner каждые 15 минут лучше, чем мощный планировщик раз в день. Дрейф плана накапливается быстрее, чем интуиция чувствует.
Constraint solver (OR-Tools) обыгрывает ML для жёстко структурированных задач. ML добавляется для предсказания + аномалий.
Anomaly detection с 12-минутной реакцией спасает от ситуаций, где 3 часа = поздно. Особенно в атомной отрасли.
«AI предлагает, человек решает» — обязательный фрейм для критических операций. Иначе adoption ноль.

← Кейсы