Дарья Шатько, руководитель ML-группы в Yandex Crowd, вместе с коллегой Антоном Удаловым внедряла большие языковые модели в контроль качества клиентской поддержки. В статье она рассказывает, почему не подошли регулярки и BERT, как был собран репрезентативный golden-датасет, как удалось победить лимит контекста и снизить ложные срабатывания через многоступенчатый LLM-flow, а также как в итоге удалось покрыть проверками все диалоги поддержки.