Как ролевые игры с драконом могут научить ИИ манипулировать и убеждать

Мастер подземелий

Искусственный интеллект, который выполняет квесты в текстовой приключенческой игре, разговаривая с персонажами, научился не только действовать самостоятельно, но и заставлять других что-то делать. Такая система — это шаг к созданию машин, способных использовать естественный язык как способ достижения своих целей.

Алгоритмы обработки естественных языковых моделей, такие как GPT-3, отлично имитируют написанные человеком предложения, штампуют истории, фальшивые блоги и сообщения. Но в этом плодотворном продукте нет особого смысла, кроме самого создания текста. Когда люди используют язык, они используют его как инструмент: наши слова убеждают, командуют и манипулируют; они заставляют людей смеяться и плакать.

Чтобы создать ИИ, который не зря использовал бы слова, исследователи из Технологического института Джорджии в Атланте и Facebook AI Research объединили методы обработки естественного языка с обучением, благодаря которому модели машинного обучения учатся достигать заданные цели.

Как общаться с драконом?

Исследователи обучили свою систему в текстовой многопользовательской игре под названием LIGHT, разработанной Facebook в прошлом году для изучения общения между людьми и игроками с ИИ. Действие игры разворачивается в тематическом фэнтезийном мире, наполненном тысячами краудсорсинговых объектов, персонажей и локаций, которые описываются и взаимодействуют с экранным текстом. Игроки (человек или компьютер) действуют, выбирая такие команды, как «обнять волшебника», «убить дракона» или «снять шляпу». Они также могут разговаривать с персонажами, управляемыми чат-ботами.

Искусственному интеллекту в этой игре досталась роль дракона, который получал определённые миссии, например, накопление золота. Чтобы добиться успеха в выполнении заданий, он должен был общаться с другими агентами-ИИ или реальными геймерами, просто вводя определённые команды, как и в любом другом текстовом приключении.
Результаты были немного странными: дракон выдавал бессмысленные угрозы, чтобы заставить персонажей выполнять его желания. Однако согласно исследованиям команды, ИИ всё-таки добился своего за счёт того, что начал понимать индивидуальные особенности общения разных реальных персонажей.

Общая архитектура и процесс обучения на основе естественного языка. Компоненты, закрашенные синим, можно предварительно обучить и компоненты, заштрихованные красным, обучаются с помощью естественного языка. Большие стрелки обозначают градиентный поток.

Чтобы объяснить своему ИИ причину, по которой он что-то делает, исследователи добавили около 7500 краудсорсинговых квестов, не включённых в оригинальную версию LIGHT. Они также создали граф знаний (база данных отношений “субъект-отношение-объект”), который давал ИИ здравую информацию об игровом мире и связях между его персонажами. Например, принцип, согласно которому торговец будет доверять только охраннику, если они друзья. В игре появились действия, такие как «Иди в горы» и «Съешь рыцаря», которые нужно выполнять для прохождения квестов (например, «Построй самый большой клад сокровищ, когда-либо найденный драконом»).

Собрав всё это вместе, разработчики обучили ИИ выполнять квесты, просто используя естественный язык. Для выполнения какого-либо из действий человек может либо ввести соответствующую команду, либо достичь того же результата, разговаривая с другими персонажами. Например, если искусственному интеллекту нужен меч, он может украсть его или убедить другого персонажа отдать его меч.

Пример диалога человека (серый цвет), выполняющего свою миссию, с ИИ (синий цвет).

Конечно, на сегодняшний день эта система — просто игрушка. И манера общения искусственного интеллекта с реальными игроками может показаться довольно прямолинейной: в какой-то момент, когда ему нужно ведро, он просто говорит: «Дай мне это ведро, или я скормлю тебя своей кошке!». Но смешение обработки естественного языка с обучением — захватывающий шаг, который может привести не только к созданию более совершенных чат-ботов, способных спорить и убеждать, но и к тем, которые лучше понимают, как устроен наш наполненный языками мир.

Список литературы:

To teach an AI to purpose goals, scientists made it play an RPG [Электронный ресурс]. URL: futurism.com/the-byte/ai-goals-rpg
How role-playing a dragon can teach an AI to manipulate and persuade // MIT Technology Review [Электронный ресурс]. URL: www.technologyreview.com/2020/11/20/1012400/games-role-playing-teach-ai-nlp-language-tool-chatbots-facebook
How to motivate your dragon: teaching goal-driven agents to speak and act in fantasy worlds // Официальный доклад разработчиков [Электронный ресурс]. URL: arxiv.org/pdf/2010.00685.pdf

Источник: https://habr.com/ru/post/529492/

Вернуться к списку

Интересные статьи

Сейчас я буду убеждать вас использовать статический анализ в PHP

Я помню выход PHP7: появились strict types, скалярные type hint-ы. Мы начали двигаться в сторону языка со статической типизацией, но типизация не ушла в статику. Концептуально все...

Как мы сыграли на выпивание с Ричардом Левелордом Греем: личная жизнь, любимые игры и о Москве

20 июля в нашем инстаграм-аккаунте прошел прямой эфир с Ричардом Левелордом Греем — создателем игр Duke Nukem 3D, SiN, Blood. Также Ричард создал несколько уровней для Quake: Scou...

Погодные радары: как они помогают предсказывать погоду и защитят ли Олимпийские игры 2020 от «партизанских ливней»?

У природы есть плохая погода, и мы в Toshiba в этом не сомневаемся. Но эффективно прогнозировать ненастья человечество научилось совсем недавно, и путь к этим достижениям лежал через личные т...

Второй слой разработки (мобильной игры), что, когда и зачем

В последнее время стараюсь раз в неделю скачать и посмотреть новую мобильную игру, и про себя отметил что у многих проектов плохо реализованы — отзывчивость интерфейса, микроанимации, пропущены л...

От пяти копеек до игры божеств

Доброго дня. В прошлой своей статье я затронул тему настольно-ролевых конкурсов, которые, как и всевозможные инди-джемы для разработчиков софта, помогают концептам и наброскам развиться в неч...