Разбираем на запчасти поисковый сервис в Яндекс Лавке

Краткий пересказ от YandexGPT

Николай Смирнов, ML-инженер в команде поиска Яндекс Лавки, описывает путь от начальных решений (алгоритм Ахо — Корасик, SaaS и Маркет) до собственной архитектуры на C++ с userver и многослойным «бургером» из ML-моделей. В статье рассказывается, зачем Поиску Лавки понадобилось сразу несколько технологий — BM25, DSSM, BERT и CatBoost — и чем полезна каждая из них. Как поиск собирает данные о пользователях и о товарах, и почему ML-модели приходится дообучать. Статья включает инженерные находки и живые примеры работы поиска в Лавке.

Перейти