Различные люди имеют уникальные потребности и предпочтения, особенно касательно уборки и поддержания чистоты, они обычно различны. Идеально было бы, чтобы роботы, особенно те, которые предназначены для помощи в домашних делах, могли выполнять задачи, учитывая эти индивидуальные предпочтения.

Недавно исследователи из Принстонского и Стэнфордского университетов занялись персонализацией помощи, предоставляемой домашними роботами, с помощью моделей большого языка (LLM). Эти модели искусственного интеллекта становятся все более популярными после выпуска ChatGPT. Подход исследователей, описанный в предварительно опубликованной статье на платформе arXiv, был изначально протестирован на мобильном роботе с именем TidyBot, разработанном для уборки в помещении.

"Чтобы робот мог эффективно персонализировать физическую помощь, он должен изучить предпочтения пользователей, которые, как правило, могут быть повторно применены к будущим сценариям", - написали Джимми Ву, Рика Антонова и их коллеги в своей статье. "В этой работе мы исследуем персонализацию уборки дома с помощью роботов, которые могут убирать комнаты, подбирая предметы и убирая их".

Исследователи предложили подход, основанный на широко известных возможностях суммирования моделей большого языка (LLM), таких как ChatGPT. Эти модели способны обобщать информацию или предоставлять обобщенные рекомендации, основываясь на небольших наборах данных или примерах сценариев.

В своем исследовании Ву, Антонова и их коллеги использовали LLM для создания "сводок" о предпочтениях пользователей в области уборки. Эти сводки основывались на различных входных данных, предоставляемых пользователями. Например, пользователь мог ввести текстовую информацию, такую как "Красная одежда идет в ящик, а белая - в шкаф", и модель формулировала обобщенные предпочтения, которые затем могли использоваться для управления действиями робота.

«Например, один человек может предпочесть хранить рубашки в ящике, в то время как другой может предпочесть их на полке. Мы стремимся создавать системы, которые могут узнать такие предпочтения из нескольких примеров посредством предыдущего взаимодействия с конкретным человеком. Мы показываем, что роботы могут сочетать языковое планирование и восприятие с возможностями суммирования нескольких снимков больших языковых моделей (LLM), чтобы вывести обобщенные предпочтения пользователей, которые широко применимы к будущим взаимодействиям», - сообщают ученые.

Для оценки своего подхода исследователи провели серию тестов, оценивая как обобщенные предпочтения, созданные на основе текстовых наборов данных, так и их влияние на способность реального робота выполнять персонализированную уборку. Они специально применили этот подход к роботу TidyBot, разработанному ими, который осуществляет уборку пола и собирает случайные объекты на нем, размещая их в определенных местах.

Этот подход обеспечивает быструю адаптацию и достигает точности 91,2% в определении объектов. Специалисты также продемонстрировали эффективность этого подхода на реальном мобильном манипуляторе под названием TidyBot, который успешно удаляет 85,0% объектов в реальных тестовых сценариях.

Недавние исследования этой группы ученых подчеркивают потенциал моделей большого языка (LLM) не только в качестве инструментов для помощи пользователям в решении письменных задач или ответов на вопросы, но и для расширения возможностей роботизированных систем. В будущем это может вдохновить другие команды начать исследования потенциала этих моделей в области робототехники.

Предложенный исследователями подход, основанный на моделях большого языка (LLM), и разработанный ими робот TidyBot, может стать основой для создания все более продвинутых домашних роботов, способных выполнять задачи по дому и подстраиваться под предпочтения пользователей при уборке окружающей среды. Дальнейшие исследования могут улучшить этот метод и повысить его эффективность, например, позволить ему лучше справляться в условиях сильного загромождения. Информация об этом размещена в научном журнале Tech Xplore.