⚛️
Energy · Росатом

Росатом: цифровой двойник АЭС сократил сроки ремонта реактора на 19 дней

Средняя длительность PPR сократилась с 53 дней до 34 — это 19 дней экономии. В пересчёте на 9 ремонтов 2024 года — 171 день дополнительной выработки на 38 миллиардов рублей. Утилизация специалистов выросла с 88% до 96% — те же люди делают больше работы. Количество «каскадных» задержек (когда одна операция сдвигает 5+ других) упало с 47 случаев за PPR до 6. Re-planner каждые 15 минут не даёт времени «накопить» сдвиги — они изолируются и обрабатываются локально. Дополнительный эффект: безопасность. Anomaly detector с 12-минутной реакцией предотвратил два потенциально опасных инцидента в 2024 году: бригада начала разборку одного из вспомогательных контуров, не убедившись что соседний под давлением. Сигнал ушёл в 67 секунд, площадка остановлена за 4 минуты. Без AI это могло перейти в реальное событие. Ключевая сложность реализации — культурная. Бригадиры с 30-летним опытом не любят, когда «компьютер» переставляет им порядок работ. Команда сделала важный фрейм: «компьютер не приказывает, он предлагает альтернативы, решает бригадир». Принимаемость рекомендаций выросла с 23% (первые 3 месяца) до 81% (после 14 месяцев работы).

-19 дн
длительность PPR
₽38B
доп. выработка/год
88→96%
утилизация людей
12 мин
реакция на аномалию

Контекст

Росатом эксплуатирует 11 атомных электростанций в России с 38 энергоблоками. Каждый блок производит примерно 7 ТВт·ч электроэнергии в год — на сумму около 21 миллиарда рублей. Раз в 12-18 месяцев каждый блок останавливается на плановый ремонт и перегрузку топлива (PPR — Планово-Предупредительный Ремонт). PPR длится в среднем 53 дня. Каждый день простоя — 58 миллионов рублей упущенной выручки + затраты на компенсацию мощностей из других источников. Только в 2024 году Росатом провёл 9 PPR — это 477 дней суммарного простоя.

Проблема

Планирование PPR — оркестровка из 8 400 операций, 14 подрядных организаций, ~3 000 человек на площадке одновременно. Каждая операция имеет dependencies: ты не можешь начать разборку парогенератора до того, как уберут давление; не можешь подвести оборудование до того, как освободят проход. Раньше планирование велось в гигантском MS Project: каждый раз ремонтник лез в Excel смотреть, кто кого ждёт.

Проблема: в реальности 18% операций отставали от плана из-за непредвиденных задержек: повреждение оборудования, погодные условия, проблемы у субподрядчика, неожиданные находки при разборке (например, обнаружили коррозию там, где её не должно было быть). Каждая задержка каскадно сдвигала весь критический путь. План терял актуальность за 3-4 дня — а ремонт длится 50+.

Вторая проблема — недоиспользование персонала. В среднем 12% времени специалистов уходило на «ждать, пока освободится участок». Высококвалифицированный сварщик, которому платят 14 000 ₽ в час, просто стоял в раздевалке.

Решение

Росатом построил «цифровой двойник» каждого блока АЭС в формате living model. Это не просто 3D-визуализация (которую все ожидают, услышав «цифровой двойник»), а полная dependency graph всех 8 400 операций PPR плюс live data feed от ремонтных бригад через мобильное приложение: каждая бригада отмечает прогресс операции в реал-тайм, плюс датчики на критическом оборудовании показывают реальное физическое состояние.

Поверх digital twin работают три модели машинного обучения. Первая — re-planner: каждые 15 минут пересчитывает оптимальный план оставшихся операций с учётом текущего реального состояния. Использует mixed integer programming с ограничениями (constraint solver Google OR-Tools, custom branch-and-bound) — 8 400 переменных, 22 000 связей, решается за 8-12 минут на 96 vCPU.

Вторая модель — predictor: предсказывает риск задержки конкретной операции на основе истории (где раньше были задержки, на каком этапе) + текущих параметров (опыт бригады, состояние оборудования, доступность запчастей на складе блока). Это даёт начальникам участков «карту риска» на завтрашний день — где быть особенно внимательным.

Третья — anomaly detector: ловит «неожиданности» из data feed (например, бригада начала операцию, которая по графику не должна была начинаться) и автоматически генерирует alert в командный центр PPR. Это сократило среднее время реакции на проблему с 3 часов до 12 минут.

Результат

Средняя длительность PPR сократилась с 53 дней до 34 — это 19 дней экономии. В пересчёте на 9 ремонтов 2024 года — 171 день дополнительной выработки на 38 миллиардов рублей. Утилизация специалистов выросла с 88% до 96% — те же люди делают больше работы.

Количество «каскадных» задержек (когда одна операция сдвигает 5+ других) упало с 47 случаев за PPR до 6. Re-planner каждые 15 минут не даёт времени «накопить» сдвиги — они изолируются и обрабатываются локально.

Дополнительный эффект: безопасность. Anomaly detector с 12-минутной реакцией предотвратил два потенциально опасных инцидента в 2024 году: бригада начала разборку одного из вспомогательных контуров, не убедившись что соседний под давлением. Сигнал ушёл в 67 секунд, площадка остановлена за 4 минуты. Без AI это могло перейти в реальное событие.

Ключевая сложность реализации — культурная. Бригадиры с 30-летним опытом не любят, когда «компьютер» переставляет им порядок работ. Команда сделала важный фрейм: «компьютер не приказывает, он предлагает альтернативы, решает бригадир». Принимаемость рекомендаций выросла с 23% (первые 3 месяца) до 81% (после 14 месяцев работы).

Технологический стек
Google OR-Tools (CP-SAT solver)Custom MIP schedulerApache Kafka (event stream)TimescaleDBPyTorch (predictor + anomaly detector)Unity 3D (digital twin visualization)iOS/Android crew app
Сроки
Прототип на 1 блок Ленинградской АЭС — 14 месяцев. Полная digital twin модель — ещё 8 месяцев. ML-слой поверх — 6 месяцев. Раскатка на все 38 блоков — 24 месяца суммарно.
Команда
127 человек: digital twin engineers (28), ML (18), nuclear domain experts (22), backend (16), mobile (12), 3D viz (11), data engineers (10), QA (10)

Уроки для индустрии

  1. «Цифровой двойник» это dependency graph + live data feed, а не 3D-картинка. 3D — это UI поверх.
  2. Re-planner каждые 15 минут лучше, чем мощный планировщик раз в день. Дрейф плана накапливается быстрее, чем интуиция чувствует.
  3. Constraint solver (OR-Tools) обыгрывает ML для жёстко структурированных задач. ML добавляется для предсказания + аномалий.
  4. Anomaly detection с 12-минутной реакцией спасает от ситуаций, где 3 часа = поздно. Особенно в атомной отрасли.
  5. «AI предлагает, человек решает» — обязательный фрейм для критических операций. Иначе adoption ноль.
← Кейсы