Мастер подземелий
Искусственный интеллект, который выполняет квесты в текстовой приключенческой игре, разговаривая с персонажами, научился не только действовать самостоятельно, но и заставлять других что-то делать. Такая система — это шаг к созданию машин, способных использовать естественный язык как способ достижения своих целей.
Алгоритмы обработки естественных языковых моделей, такие как GPT-3, отлично имитируют написанные человеком предложения, штампуют истории, фальшивые блоги и сообщения. Но в этом плодотворном продукте нет особого смысла, кроме самого создания текста. Когда люди используют язык, они используют его как инструмент: наши слова убеждают, командуют и манипулируют; они заставляют людей смеяться и плакать.
Чтобы создать ИИ, который не зря использовал бы слова, исследователи из Технологического института Джорджии в Атланте и Facebook AI Research объединили методы обработки естественного языка с обучением, благодаря которому модели машинного обучения учатся достигать заданные цели.
Как общаться с драконом?
Исследователи обучили свою систему в текстовой многопользовательской игре под названием LIGHT, разработанной Facebook в прошлом году для изучения общения между людьми и игроками с ИИ. Действие игры разворачивается в тематическом фэнтезийном мире, наполненном тысячами краудсорсинговых объектов, персонажей и локаций, которые описываются и взаимодействуют с экранным текстом. Игроки (человек или компьютер) действуют, выбирая такие команды, как «обнять волшебника», «убить дракона» или «снять шляпу». Они также могут разговаривать с персонажами, управляемыми чат-ботами.
Искусственному интеллекту в этой игре досталась роль дракона, который получал определённые миссии, например, накопление золота. Чтобы добиться успеха в выполнении заданий, он должен был общаться с другими агентами-ИИ или реальными геймерами, просто вводя определённые команды, как и в любом другом текстовом приключении.
Результаты были немного странными: дракон выдавал бессмысленные угрозы, чтобы заставить персонажей выполнять его желания. Однако согласно исследованиям команды, ИИ всё-таки добился своего за счёт того, что начал понимать индивидуальные особенности общения разных реальных персонажей.
Общая архитектура и процесс обучения на основе естественного языка. Компоненты, закрашенные синим, можно предварительно обучить и компоненты, заштрихованные красным, обучаются с помощью естественного языка. Большие стрелки обозначают градиентный поток.
Чтобы объяснить своему ИИ причину, по которой он что-то делает, исследователи добавили около 7500 краудсорсинговых квестов, не включённых в оригинальную версию LIGHT. Они также создали граф знаний (база данных отношений “субъект-отношение-объект”), который давал ИИ здравую информацию об игровом мире и связях между его персонажами. Например, принцип, согласно которому торговец будет доверять только охраннику, если они друзья. В игре появились действия, такие как «Иди в горы» и «Съешь рыцаря», которые нужно выполнять для прохождения квестов (например, «Построй самый большой клад сокровищ, когда-либо найденный драконом»).
Собрав всё это вместе, разработчики обучили ИИ выполнять квесты, просто используя естественный язык. Для выполнения какого-либо из действий человек может либо ввести соответствующую команду, либо достичь того же результата, разговаривая с другими персонажами. Например, если искусственному интеллекту нужен меч, он может украсть его или убедить другого персонажа отдать его меч.
Пример диалога человека (серый цвет), выполняющего свою миссию, с ИИ (синий цвет).
Конечно, на сегодняшний день эта система — просто игрушка. И манера общения искусственного интеллекта с реальными игроками может показаться довольно прямолинейной: в какой-то момент, когда ему нужно ведро, он просто говорит: «Дай мне это ведро, или я скормлю тебя своей кошке!». Но смешение обработки естественного языка с обучением — захватывающий шаг, который может привести не только к созданию более совершенных чат-ботов, способных спорить и убеждать, но и к тем, которые лучше понимают, как устроен наш наполненный языками мир.
Список литературы:
- To teach an AI to purpose goals, scientists made it play an RPG [Электронный ресурс]. URL: futurism.com/the-byte/ai-goals-rpg
- How role-playing a dragon can teach an AI to manipulate and persuade // MIT Technology Review [Электронный ресурс]. URL: www.technologyreview.com/2020/11/20/1012400/games-role-playing-teach-ai-nlp-language-tool-chatbots-facebook
- How to motivate your dragon: teaching goal-driven agents to speak and act in fantasy worlds // Официальный доклад разработчиков [Электронный ресурс]. URL: arxiv.org/pdf/2010.00685.pdf