Нейросети для госсектора: кейс автоматизации обращений
Городской многофункциональный центр — 1200 обращений в день, 18 операторов, средний срок ответа 4 рабочих дня. Именно с такой точки старта мы начали внедрение LLM-решения для автоматической классификации и первичной обработки запросов граждан…
Почему именно классификация обращений — точка входа для ИИ в госструктурах
Госсектор — сложная среда для ИИ-проектов: закрытая инфраструктура, регуляторные ограничения, требования к суверенности данных. Поэтому стартовать с глобальной «цифровой трансформации» — путь к провалу. Рабочая стратегия — найти один перегруженный, повторяющийся процесс и показать измеримый результат за 6–8 недель.
Классификация входящих обращений подходит идеально: данные уже есть (архив за несколько лет), структура задачи понятна (текст → категория → ответственный отдел → шаблон ответа), а ошибка алгоритма на этом этапе некритична — оператор всегда может скорректировать. Это снижает внутреннее сопротивление команды и даёт пространство для обучения модели на реальных данных без рисков.
В нашем кейсе архив содержал порядка 140 000 исторических обращений с разметкой по 34 категориям. Этого объёма хватило для fine-tuning модели с точностью классификации выше 91% уже на первом цикле обучения.
Этапы внедрения: от аудита данных до продуктива
**Этап 1 — Аудит и подготовка данных (2 недели).** Самый недооценённый этап. Из 140 000 записей около 23% оказались дублями, некорректно размеченными или содержали персональные данные в открытом виде. Очистка и анонимизация — обязательное условие, особенно в государственном контексте. На выходе — 108 000 качественных примеров.
**Этап 2 — Выбор и адаптация модели (1,5 недели).** Принципиальное требование заказчика: данные не покидают периметр. Мы развернули open-source LLM на собственных серверах учреждения, провели дообучение на отраслевой лексике (юридические формулировки, специфика ЖКХ, социальных выплат). Никаких внешних API с передачей данных — это не опция, это условие проекта.
**Этап 3 — Интеграция и пилот (3 недели).** Модель подключили к существующей CRM через REST API. Первые две недели — параллельная работа: ИИ классифицирует, оператор подтверждает или исправляет. Эти данные сразу шли на дообучение. К концу третьей недели процент подтверждений без правок достиг 87%. **Этап 4 — Масштабирование и автоответы (2 недели).** На базе классификатора подключили генерацию шаблонных ответов для 11 самых частотных категорий (они закрывали 54% всего потока). Ответ формируется автоматически, проходит проверку оператора и отправляется — время на такое обращение сократилось с 4 дней до 6 часов.
Ориентировочные результаты: на что реально рассчитывать
Через 10 недель после старта продуктива цифры выглядели так: среднее время закрытия обращения — минус 60% (с 4 рабочих дней до 1,5); нагрузка на операторов по рутинной классификации — минус 70%; количество ошибочных маршрутизаций (обращение попало не в тот отдел) — минус 55%; удовлетворённость граждан по NPS-опросу после обращения — плюс 18 пунктов.
Важная оговорка: это ориентиры конкретного проекта с конкретной структурой данных. В учреждении с меньшим архивом или более разнородной тематикой обращений результат может быть скромнее на старте, но динамика улучшения при правильном цикле переобучения — устойчивая. Закладывайте на выход в стабильные показатели 3–4 месяца после запуска.
Отдельно стоит отметить: операторы не были сокращены. Высвободившееся время перенаправили на работу со сложными, нестандартными обращениями — теми 13% случаев, где модель неуверена и ставит флаг «требует человека». Это политически важный момент для любого госпроекта: ИИ как усилитель команды, а не замена.
Главные подводные камни в ИИ-проектах для государственных структур
**Суверенность данных.** В 2026 году это не просто пожелание — это требование, которое нужно закрыть архитектурно ещё до старта разработки. On-premise развёртывание, изолированный контур, журналирование запросов к модели — всё это должно быть в техническом задании, а не возникать как «а вдруг спросят» за неделю до сдачи.
**Сопротивление сотрудников.** В госструктурах оно выше, чем в коммерции, и имеет другую природу: не страх увольнения, а страх ответственности («а если ИИ ошибётся — кто виноват?»). Решение — чёткий регламент: модель предлагает, человек подтверждает, ответственность всегда на операторе. Это нужно зафиксировать документально до запуска пилота.
**Качество входных данных.** Государственные архивы часто ведутся непоследовательно: разные форматы за разные периоды, непоследовательная разметка, человеческие ошибки в исторических записях. Закладывайте на очистку данных не меньше 30% от общего бюджета проекта — это не накладные расходы, это фундамент точности модели.
Как масштабировать успех: следующие шаги после первого кейса
Классификатор обращений — это точка входа, а не финальная цель. После того как первый модуль показал результат и получил внутреннее доверие, открывается дорога к следующим слоям автоматизации: умный поиск по нормативной базе для операторов, предиктивный анализ пиков нагрузки, голосовой ввод обращений через Telegram-бот или mini app. Каждый следующий шаг опирается на данные и экспертизу, накопленные на предыдущем.
Принципиально важно строить архитектуру так, чтобы каждый новый модуль подключался к уже работающему контуру, а не требовал отдельной инфраструктуры. Это снижает стоимость масштабирования и сокращает время согласований — для госсектора критически важный фактор.