Как робот научился властвовать за теннисным столом

Считаете ли вы, что у вас есть шанс победить робота в настольный теннис? Согласно статье, опубликованной в MIT Technology Review, компания Google DeepMind обучила робота играть в эту игру на уровне любительских соревнований. Утверждается, что это первый случай, когда робота научили играть в спорт с людьми на человеческом уровне.
Исследователям удалось заставить роботизированную руку с 3D-печатной ракеткой выиграть 13 из 29 игр против человеческих противников разного уровня подготовки в полноценных соревновательных играх в настольный теннис.
Система далека от совершенства. Хотя робот-теннисист смог победить всех начинающих игроков, с которыми он столкнулся, и 55% игроков любительского уровня, он проиграл все игры против продвинутых игроков. Тем не менее, это впечатляющий прогресс.
"Даже несколько месяцев назад мы предполагали, что робот, вероятно, не сможет выиграть у людей, с которыми он раньше не играл. Система определенно превзошла наши ожидания", - говорит Паннаг Санкети, старший инженер-программист Google DeepMind, руководивший проектом. "То, как робот переигрывал даже сильных противников, было поразительным".
И это исследование - не просто развлечение. На самом деле, оно представляет собой шаг к созданию роботов, которые могут умело и безопасно выполнять полезные задачи в реальных средах, таких как дома и склады, что является давней целью робототехнического сообщества. Подход Google DeepMind к обучению машин применим ко многим другим областям в этой сфере, говорит Леррел Пинто, исследователь в области компьютерных наук из Нью-Йоркского университета, не участвовавший в проекте.
"Я большой поклонник робототехнических систем, которые действительно работают с реальными людьми и вокруг них, и это фантастический пример этого", - говорит он. "Возможно, это не сильный игрок, но здесь есть все необходимые составляющие, чтобы продолжать совершенствоваться и в конечном итоге достичь этого уровня".
Чтобы стать умелым игроком в настольный теннис, людям требуется отличная координация рук и глаз, способность быстро двигаться и принимать быстрые решения, реагируя на противника - все это представляет значительные проблемы для роботов. Исследователи Google DeepMind использовали двухэтапный подход для обучения системы имитации этих способностей: они использовали компьютерное моделирование для обучения системы мастерству ударов, а затем оттачивали ее, используя данные реального мира, что позволяет ей совершенствоваться со временем.
Исследователи составили набор данных о состояниях мяча для настольного тенниса, включая данные о положении, вращении и скорости. Система использовала эту библиотеку в симулированной среде, разработанной для точного отражения физики матчей настольного тенниса, чтобы научиться таким навыкам, как возврат подачи, удар форхендом с верхним вращением или удар бэкхендом. Поскольку ограничения робота означали, что он не мог подавать мяч, реальные игры были модифицированы для учета этого.
Во время своих матчей против людей робот собирает данные о своей производительности, чтобы помочь усовершенствовать свои навыки. Он отслеживает положение мяча с помощью данных, захваченных парой камер, и следит за стилем игры своего человеческого противника через систему захвата движения, использующую светодиоды на ракетке противника. Данные о мяче подаются обратно в симуляцию для обучения, создавая непрерывный цикл обратной связи. Эта обратная связь позволяет роботу тестировать новые навыки, чтобы попытаться победить своего противника, что означает, что он может корректировать свою тактику и поведение так же, как это делал бы человек. Это означает, что он становится прогрессивно лучше как в течение данного матча, так и со временем, чем больше игр он играет. Система испытывала трудности с ударом по мячу, когда он был отбит либо очень быстро, либо за пределами ее поля зрения (более шести футов над столом), либо очень низко, из-за протокола, который инструктирует ее избегать столкновений, которые могли бы повредить ее ракетку. Закрученные мячи представляли проблему, потому что у нее не было возможности напрямую измерять вращение - ограничение, которое быстро использовали продвинутые игроки. Обучение робота всем возможностям в симулированной среде - это настоящая проблема, говорит Крис Уолти, основатель робототехнической компании Mytra и бывший руководитель команды робототехники Tesla, не участвовавший в проекте. "Очень, очень сложно на самом деле смоделировать реальный мир, потому что там так много переменных, как порыв ветра или даже пыль [на столе]", - говорит он. "Если у вас нет очень реалистичных симуляций, производительность робота будет ограничена". Google DeepMind считает, что эти ограничения могут быть решены несколькими способами, включая разработку прогнозирующих ИИ-моделей, предназначенных для предсказания траектории мяча, и внедрение лучших алгоритмов обнаружения столкновений. Важно отметить, что человеческие игроки наслаждались своими матчами против роботизированной руки. Даже продвинутые соперники, которые смогли победить ее, сказали, что нашли опыт веселым и увлекательным, и заявили, что она имеет потенциал в качестве динамичного партнера по тренировкам, чтобы помочь им отточить свои навыки. "Я определенно хотел бы иметь его в качестве партнера по тренировкам, кого-то, с кем можно время от времени играть несколько матчей", - сказал один из участников исследования.




