📬
Logistics · Почта России

Почта России: OCR + AI-роутер сократил время обработки посылки на 38%

Среднее время обработки одной посылки на сортировочном центре сократилось с 47 до 29 секунд (-38%). Точность чтения адреса выросла с 96.3% (ручной ввод) до 99.4% (OCR). Команда вручную сортирующих операторов сократилась с 8 200 до 2 300 — оставшиеся работают только на сложных случаях, которые ансамбль не смог расшифровать. Ключевая метрика — % посылок, доставленных в нормативный срок. До: 81%. После: 96%. Это вернуло доверие пользователей к госпочте: в 2024 году NPS Почты России впервые за десятилетие стал положительным (+14, было -23 в 2022). Декабрьский кризис 2024 года прошёл практически незаметно: пиковая нагрузка обработана теми же мощностями, очередей не было. Экономика проекта: инвестиции 4.7 миллиарда рублей (железо + разработка + интеграция). Прямая экономия — 8.1 миллиарда рублей в год на сокращении ручной работы. ROI окупился за 7 месяцев. Дополнительная выгода: снижение возвратов «адрес не найден» сократило логистические расходы ещё на 1.2 миллиарда рублей.

-38%
время обработки
99.4%
точность OCR
₽8.1B
экономия/год
81→96%
доставка в срок

Контекст

Почта России — крупнейший логистический оператор страны: 38 000 отделений, 230 000 сотрудников, 7.8 миллиона почтовых отправлений в день. Поток включает 4.2 миллиона посылок (e-commerce), 2.1 миллиона писем (юридически значимая корреспонденция), 1.5 миллиона мелких пакетов. Главные сортировочные центры — в Москве (Внуково), Санкт-Петербурге, Новосибирске, Хабаровске. До 2023 года значительная часть рутинной работы — чтение и сортировка — выполнялась вручную: 8 200 операторов сидели у конвейерных лент и набивали индексы получателя.

Проблема

Главные проблемы — точность распознавания, скорость и стоимость. Точность ручного ввода — 96.3% (3.7% посылок шли по неверному адресу, что давало 290 000 «потерянных» отправлений в день, около 0.4% объёма). Скорость — оператор вводит 800-1 100 индексов в час. Стоимость — 18 рублей на одну посылку только за ручную сортировку, без учёта зарплат на других этапах.

Дополнительная проблема — почерк. 23% адресов написаны от руки (особенно в регионах). Старые OCR-системы (закупленные в 2017) распознавали типографские шрифты на 89%, но печатные буквы от руки — на 71%, прописные — на 43%. Эти 23% всегда уходили на ручную обработку.

И самое болезненное — пиковые сезоны. В декабре поток вырастает в 2.4 раза. В 2022 году в декабре в Москве лежало 12 миллионов необработанных посылок одновременно — все ленты конвейеров были забиты, операторов не хватало. Срок доставки внутри РФ растягивался с 4 до 14 дней. Жалобы в Минцифры били рекорды.

Решение

Команда Почты построила двухслойный pipeline. Первый слой — современный OCR на трёх моделях, работающих параллельно. Vision Transformer (custom-trained на 14 миллионах помеченных снимков посылок Почты) — для типографских шрифтов, 99.1% accuracy. TrOCR (Microsoft, fine-tuned на русском handwriting) — для печатных букв от руки, 94% accuracy. Третья модель — Donut OCR (NAVER), используется как «второй глаз»: смотрит на тот же снимок и сверяется с первой моделью. Если две модели несогласны — снимок уходит человеку.

Второй слой — AI router: на основе распознанного адреса оптимально маршрутизирует посылку через сеть сортировочных центров. Раньше: жёсткая логика «область → региональный центр → отделение». Теперь: модель учитывает текущую загруженность каждого центра, время доставки, маршруты транспорта (фуры, авиа, ж/д), стоимость передачи. На выходе — оптимальный маршрут под текущую сетевую ситуацию.

Хардвер на сортировочных центрах: камера 4K над конвейерной лентой, скорость ленты 1.4 м/с (2 пакета в секунду). Каждый кадр обрабатывается на локальном edge-сервере (NVIDIA A2 ×4 на центр) за 380 мс. Решение принимается до того, как посылка дойдёт до следующего узла сортировочной развилки.

Особая фишка — feedback loop. Если посылка вернулась как «адрес не найден» — система делает retrospective analysis: какая модель ошиблась, какой был ground truth, использует это как новый training sample. Continuous learning без human-in-the-loop. Сейчас модели re-train каждые 6 часов.

Результат

Среднее время обработки одной посылки на сортировочном центре сократилось с 47 до 29 секунд (-38%). Точность чтения адреса выросла с 96.3% (ручной ввод) до 99.4% (OCR). Команда вручную сортирующих операторов сократилась с 8 200 до 2 300 — оставшиеся работают только на сложных случаях, которые ансамбль не смог расшифровать.

Ключевая метрика — % посылок, доставленных в нормативный срок. До: 81%. После: 96%. Это вернуло доверие пользователей к госпочте: в 2024 году NPS Почты России впервые за десятилетие стал положительным (+14, было -23 в 2022). Декабрьский кризис 2024 года прошёл практически незаметно: пиковая нагрузка обработана теми же мощностями, очередей не было.

Экономика проекта: инвестиции 4.7 миллиарда рублей (железо + разработка + интеграция). Прямая экономия — 8.1 миллиарда рублей в год на сокращении ручной работы. ROI окупился за 7 месяцев. Дополнительная выгода: снижение возвратов «адрес не найден» сократило логистические расходы ещё на 1.2 миллиарда рублей.

Технологический стек
Vision Transformer (custom)TrOCR (Microsoft, RU-tuned)Donut OCR (NAVER)NVIDIA A2 ×4 per sort centerApache Kafka (frame stream)Custom AI router (PyTorch + OR-Tools)Continuous training pipeline (every 6h)
Сроки
Пилот в Внуково — 9 месяцев. Раскатка на 4 главных центра — ещё 7 месяцев. Региональные центры (28 точек) — 14 месяцев. Continuous training работает с 2024.
Команда
68 человек: CV/ML (22), backend (14), MLOps (9), domain experts (8), data engineers (7), QA (5), product (3)

Уроки для индустрии

  1. Ensemble из 3 OCR (transformer + TrOCR + Donut) точнее, чем одна большая модель. Disagreement = uncertainty.
  2. Continuous learning без human-in-the-loop работает, если есть надёжный «retrospective ground truth» — возвраты «адрес не найден».
  3. AI router (распределение нагрузки) даёт почти столько же ROI, сколько OCR. Не забывайте про второй слой.
  4. Sorting throughput — функция belt speed × frame processing time. Не оптимизируйте только модель, оптимизируйте конвейер.
  5. Сокращение штата операторов с 8 200 до 2 300 — главный политический challenge. Обучение оставшихся работать с AI важнее, чем тех, кого сократили.
← Кейсы