Оптимизация обучения и инференса моделей для генерации видео на множестве GPU

7 октября 2025

В видео Мария Ковалева, ведущий специалист по исследованию данных Sber AI, рассказывает как в команде Kandinsky обучают большие трансформеры для генерации видео: какие техники используют для эффективной утилизации кластера из огромного количества GPU. Обсуждается DDP, FSDP, activation checkpointing, tensor & sequence parallel и другие алгоритмы. На практической части мастер-класса Мария показывает, как ускорить инференс и генерацию видео, распараллелив трансформер через библиотеку pytorch с помощью алгоритма tensor parallel.

Авторы

Мария Ковалева

Яндекс Образование — Личный кабинет

Оптимизация обучения и инференса моделей для генерации видео на множестве GPU

Ещё по теме

Компьютерное зрение в 2025-м / Роман Исаченко

Тренды в NLP, обзор ICLR и ACL / Александр Юшкевич

Голосовые технологии на Interspeech и ICASSP 2025 / Борис Шелудько

Главные тренды рекомендательных систем / Николай Савушкин

Открытие ML Global Recap 2025 / Алексей Гусаков

LLM/ML для генерации и персонализации коммуникаций в CRM / Василий Бронский и Александр Безуглый

Что такое ML-аналитика, или Как измерить качество LLM-продуктов / Таймураз Тибилов

Как нейросети режут сегменты лучше кухонного ножа / Никита Алексейчук и Никита Мастюгин

YaC 2025 AI Edition

Insightus: ваш партнёр — AI-аналитик. Архитектура, сложности, потенциал / Константин Бабалян

Компьютерное зрение в 2025-м / Роман Исаченко

Тренды в NLP, обзор ICLR и ACL / Александр Юшкевич

Голосовые технологии на Interspeech и ICASSP 2025 / Борис Шелудько