Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
Технологии быстро развиваются, это касается многих отраслей и направлений. Одно из них - цифровые помощники, которые учатся общаться с человеком при помощи искусственного интеллекта. Ученым из компании Aflorithmic удалось не только научить своего робота общаться, но и восстановить голос Альберта Эйнштейна. Теперь умный ассистент компании говорит голосом великого ученого.
В проекте Aflorithmic также принял участие стартап UneeQ. Они разместили чат-бота на своем сайте, так что при желании поговорить с ним может любой желающий. Восстановление голоса ученого реализовано благодаря сохранившимся записям, пусть и плохого качества, плюс описаниям людей, которые с ним общались.
Обработанные данные показали, что ученый говорил с сильным немецким акцентом, что и раньше не являлось тайной. Плюс его голос был мягким и доброжелательным. Сказать, что голос бота идентичен голосу ученого, нельзя - но он максимально к нему приближен.
К участию в проекте привлекли еще и актера, который, изучив особенности голоса ученого, проговаривал многие современные слова и термины. Например, "блокчейн" - ведь понятно, что сам ученый этот термин не произносил.
Ниже - реальная запись выступления Эйнштейна. К сожалению, голос слышен не очень хорошо - аудиодорожка не самого лучшего качества. Но представление о стиле, тембре, манере речи ученого составить можно без проблем.
Озвучить виртуального помощникаа можно было голосом практически любого человека. Эйнштейна выбрали потому, что это один из самых известных ученых и людей вообще. Кроме того, беседы с ним, по отзывам современников, были содержательными и приятными. Людям просто нравилось разговаривать с ним. Соответственно, партнеры проекта решили попробовать синтезировать похожий голос, чтобы, например, озвучить виртуального преподавателя физики или математики.
И, к слову, цифровой агент Aflorithmic может беседовать с любым из нас, причем в режиме реального времени - задержек практически нет. Все это позволяет создать впечатление реальной беседы с живым человеком, что очень необычно. Добиться этого удалось не сразу - сначала задержка между вопросом и ответом составляла около 12 секунд. Но после доработки алгоритма этот показатель удалось снизить до 3 секунд всего за две недели.
Сейчас участники проекта стараются улучшить алгоритм и технологию синтезирования голоса Эйнштейна. Но и то, что у них уже есть - впечатляет.