В статье Алексей Лещанкин, руководитель проекта Humanoids в Яндексе, рассказывает о применении метода Lipschitz-Constrained reinforcement learning для улучшения управления гуманоидными роботами. Автор объясняет проблемы переноса симуляционных моделей на реальные роботы и описывает, как ограничение Липшица помогает сделать движения роботов более плавными и устойчивыми к сенсорному шуму. В статье подробно рассматривается принцип работы метода, его преимущества и результаты тестирования на реальных роботах Fourier GR1 и Unitree H1.