Почта России: OCR + AI-роутер сократил время обработки посылки на 38%
Среднее время обработки одной посылки на сортировочном центре сократилось с 47 до 29 секунд (-38%). Точность чтения адреса выросла с 96.3% (ручной ввод) до 99.4% (OCR). Команда вручную сортирующих операторов сократилась с 8 200 до 2 300 — оставшиеся работают только на сложных случаях, которые ансамбль не смог расшифровать. Ключевая метрика — % посылок, доставленных в нормативный срок. До: 81%. После: 96%. Это вернуло доверие пользователей к госпочте: в 2024 году NPS Почты России впервые за десятилетие стал положительным (+14, было -23 в 2022). Декабрьский кризис 2024 года прошёл практически незаметно: пиковая нагрузка обработана теми же мощностями, очередей не было. Экономика проекта: инвестиции 4.7 миллиарда рублей (железо + разработка + интеграция). Прямая экономия — 8.1 миллиарда рублей в год на сокращении ручной работы. ROI окупился за 7 месяцев. Дополнительная выгода: снижение возвратов «адрес не найден» сократило логистические расходы ещё на 1.2 миллиарда рублей.
Контекст
Почта России — крупнейший логистический оператор страны: 38 000 отделений, 230 000 сотрудников, 7.8 миллиона почтовых отправлений в день. Поток включает 4.2 миллиона посылок (e-commerce), 2.1 миллиона писем (юридически значимая корреспонденция), 1.5 миллиона мелких пакетов. Главные сортировочные центры — в Москве (Внуково), Санкт-Петербурге, Новосибирске, Хабаровске. До 2023 года значительная часть рутинной работы — чтение и сортировка — выполнялась вручную: 8 200 операторов сидели у конвейерных лент и набивали индексы получателя.
Проблема
Главные проблемы — точность распознавания, скорость и стоимость. Точность ручного ввода — 96.3% (3.7% посылок шли по неверному адресу, что давало 290 000 «потерянных» отправлений в день, около 0.4% объёма). Скорость — оператор вводит 800-1 100 индексов в час. Стоимость — 18 рублей на одну посылку только за ручную сортировку, без учёта зарплат на других этапах.
Дополнительная проблема — почерк. 23% адресов написаны от руки (особенно в регионах). Старые OCR-системы (закупленные в 2017) распознавали типографские шрифты на 89%, но печатные буквы от руки — на 71%, прописные — на 43%. Эти 23% всегда уходили на ручную обработку.
И самое болезненное — пиковые сезоны. В декабре поток вырастает в 2.4 раза. В 2022 году в декабре в Москве лежало 12 миллионов необработанных посылок одновременно — все ленты конвейеров были забиты, операторов не хватало. Срок доставки внутри РФ растягивался с 4 до 14 дней. Жалобы в Минцифры били рекорды.
Решение
Команда Почты построила двухслойный pipeline. Первый слой — современный OCR на трёх моделях, работающих параллельно. Vision Transformer (custom-trained на 14 миллионах помеченных снимков посылок Почты) — для типографских шрифтов, 99.1% accuracy. TrOCR (Microsoft, fine-tuned на русском handwriting) — для печатных букв от руки, 94% accuracy. Третья модель — Donut OCR (NAVER), используется как «второй глаз»: смотрит на тот же снимок и сверяется с первой моделью. Если две модели несогласны — снимок уходит человеку.
Второй слой — AI router: на основе распознанного адреса оптимально маршрутизирует посылку через сеть сортировочных центров. Раньше: жёсткая логика «область → региональный центр → отделение». Теперь: модель учитывает текущую загруженность каждого центра, время доставки, маршруты транспорта (фуры, авиа, ж/д), стоимость передачи. На выходе — оптимальный маршрут под текущую сетевую ситуацию.
Хардвер на сортировочных центрах: камера 4K над конвейерной лентой, скорость ленты 1.4 м/с (2 пакета в секунду). Каждый кадр обрабатывается на локальном edge-сервере (NVIDIA A2 ×4 на центр) за 380 мс. Решение принимается до того, как посылка дойдёт до следующего узла сортировочной развилки.
Особая фишка — feedback loop. Если посылка вернулась как «адрес не найден» — система делает retrospective analysis: какая модель ошиблась, какой был ground truth, использует это как новый training sample. Continuous learning без human-in-the-loop. Сейчас модели re-train каждые 6 часов.
Результат
Среднее время обработки одной посылки на сортировочном центре сократилось с 47 до 29 секунд (-38%). Точность чтения адреса выросла с 96.3% (ручной ввод) до 99.4% (OCR). Команда вручную сортирующих операторов сократилась с 8 200 до 2 300 — оставшиеся работают только на сложных случаях, которые ансамбль не смог расшифровать.
Ключевая метрика — % посылок, доставленных в нормативный срок. До: 81%. После: 96%. Это вернуло доверие пользователей к госпочте: в 2024 году NPS Почты России впервые за десятилетие стал положительным (+14, было -23 в 2022). Декабрьский кризис 2024 года прошёл практически незаметно: пиковая нагрузка обработана теми же мощностями, очередей не было.
Экономика проекта: инвестиции 4.7 миллиарда рублей (железо + разработка + интеграция). Прямая экономия — 8.1 миллиарда рублей в год на сокращении ручной работы. ROI окупился за 7 месяцев. Дополнительная выгода: снижение возвратов «адрес не найден» сократило логистические расходы ещё на 1.2 миллиарда рублей.
Уроки для индустрии
- Ensemble из 3 OCR (transformer + TrOCR + Donut) точнее, чем одна большая модель. Disagreement = uncertainty.
- Continuous learning без human-in-the-loop работает, если есть надёжный «retrospective ground truth» — возвраты «адрес не найден».
- AI router (распределение нагрузки) даёт почти столько же ROI, сколько OCR. Не забывайте про второй слой.
- Sorting throughput — функция belt speed × frame processing time. Не оптимизируйте только модель, оптимизируйте конвейер.
- Сокращение штата операторов с 8 200 до 2 300 — главный политический challenge. Обучение оставшихся работать с AI важнее, чем тех, кого сократили.