В своём докладе на Data Fest Виктория Чекалина делится методами быстрой аппроксимации матрицы Фишера для эффективного сжатия больших языковых моделей (LLM). Она объясняет, как факторизация Кронекера помогает оптимизировать этот процесс.
Сжатие LLM с помощью аппроксимации матрицы Фишера и факторизации Кронекера
Карта навыков
Узнайте, какими навыками должен обладатьИИ-разработчик