Тренировки. ML забег. Семинар №2: Основы машинного обучения

В видео представлен семинар, который посвящён основам машинного обучения на примере работы с агентами и нейросетями. Рассматривается задача такси, где модель обучается доставлять пассажира по карте, постепенно улучшая стратегию через итеративное обучение с анализом реварда и обновлением политики. Демонстрируется применение нейросетей для управления маятником, показаны подходы к обучению и анализу эффективности политик. Разбирается архитектура и работа модели CLIP, сочетающей обработку изображений и текстов: объясняются этапы препроцессинга данных, токенизации, расчёта косинусной близости и визуализации результатов, обсуждаются примеры успешной и ошибочной классификации. Кроме того, затрагиваются вопросы суммаризации больших текстов, сегментации изображений с использованием сложных моделей, трудности со специфическими классами и улучшение результатов за счёт корректных данных.