На видео — запись встречи ML‑сообщества Data Dojo в Москве. Эксперты Яндекса рассказали о ключевых трендах в области голосовых технологий, зрения и мультимодальных моделей. В докладах рассмотрены достижения в генерации изображений и видео, развитии LLM‑моделей и задачах автономного транспорта. Также обсуждены технические нюансы голосовой активации: шумоподавление, обработка звука и оптимизация нейросетей для устройств.