Прежде чем перейти к статье, хочу вам представить, экономическую онлайн игру Brave Knights, в которой вы можете играть и зарабатывать. Регистируйтесь, играйте и зарабатывайте!
Исследователи искусственного интеллекта утверждают, что сделали первое в мире научное открытие, используя большую языковую модель. Это открытие говорит о том, что технология, лежащая в основе ChatGPT и подобных программ, может генерировать информацию, выходящую за рамки человеческих знаний.
Это открытие было сделано в Google DeepMind, где учёные изучают, могут ли большие языковые модели, на которых основаны современные чат-боты, такие как ChatGPT от OpenAI и Bard от Google, делать нечто большее, чем просто перерабатывать информацию, полученную в процессе обучения, и приходить к новым открытиям.
"Когда мы начинали проект, не было никаких признаков того, что он даст что-то действительно новое", - говорит Пушмит Кохли, глава научного отдела ИИ в DeepMind. "Насколько нам известно, это первый случай, когда большая языковая модель сделала действительно новое научное открытие".
Большие языковые модели, или LLM, - это мощные нейронные сети, которые изучают закономерности языка, включая компьютерный код, на основе огромного количества текста и других данных. С момента появления ChatGPT в прошлом году технология отлаживала неисправное программное обеспечение и создавала всё, что угодно: от эссе для колледжа и маршрутов путешествий до стихов об изменении климата в стиле Шекспира.
Но хотя чат-боты оказались чрезвычайно популярными, они не генерируют новые знания и частенько выдают ерунду, что приводит к многословным ответам, похожим на правду, но в реальности часто бредовым.
Чтобы создать "FunSearch", сокращение от “searching in the function space” [поиск в функциональном пространстве], в DeepMind использовали LLM для написания решений задач в виде компьютерных программ. LLM работает в паре с "оценщиком", который автоматически ранжирует программы по степени их эффективности. Лучшие программы объединяются и передаются обратно LLM для улучшения. Это заставляет систему постоянно совершенствовать плохие программы, превращая их в более мощные, способные открывать новые знания.
Исследователи запустили FunSearch для решения двух головоломок. Первая - давняя и несколько заумная задача из аффинной геометрии, известная как проблема множества крышек. Она связана с поиском наибольшего набора точек в пространстве, в котором три точки не образуют прямую линию. FunSearch создал программы, которые генерируют новые большие наборы, превосходящие всё, что придумали математики.
Второй головоломкой была задача об упаковке контейнеров, которая позволяет найти оптимальные способы упаковки предметов разного размера в контейнеры. Хотя она относится к физическим объектам, например, к наиболее эффективному способу размещения коробок в транспортном контейнере, та же математика применима и в других областях, например, при планировании вычислительных заданий в центрах обработки данных. Обычно проблема решается либо упаковкой предметов в первый попавшийся контейнер, в котором есть место, либо в контейнер с наименьшим свободным пространством, в который предмет всё равно поместится. Согласно результатам, опубликованным в журнале Nature, FunSearch нашла лучший подход, позволяющий не оставлять небольших зазоров, которые вряд ли когда-нибудь будут заполнены.
"В последние два-три года появилось несколько интересных примеров сотрудничества математиков-людей с искусственным интеллектом для достижения успехов в решении нерешённых проблем", - говорит сэр Тим Гауэрс, профессор математики Кембриджского университета, который не принимал участия в исследовании. "Эта работа потенциально даёт нам ещё один очень интересный инструмент для такого сотрудничества, позволяя математикам эффективно искать умные и неожиданные конструкции. Ещё лучше, если эти конструкции поддаются человеческой интерпретации".
Сейчас исследователи изучают спектр научных проблем, с которыми может справиться FunSearch. Основным ограничивающим фактором является то, что проблемы должны иметь решения, которые могут быть проверены автоматически, что исключает многие вопросы в биологии, где гипотезы часто необходимо проверять с помощью лабораторных экспериментов.
Более непосредственные последствия могут быть для программистов. За последние 50 лет кодирование в основном совершенствовалось за счёт создания людьми всё более специализированных алгоритмов. "Это действительно будет трансформацией в том, как люди подходят к компьютерным наукам и алгоритмическим открытиям", - говорит Кохли. "Впервые мы видим, что магистры не берут на себя ответственность, но определённо помогают расширить границы возможного в алгоритмах".
Джордан Элленберг, профессор математики в Университете Висконсин-Мэдисон и соавтор статьи, сказал: "Что я считаю действительно захватывающим, даже больше, чем конкретные результаты, которые мы нашли, так это перспективы, которые это открывает для будущего человеко-машинного взаимодействия в математике".
"Вместо того чтобы генерировать решение, FunSearch генерирует программу, которая находит решение. Решение конкретной задачи может не дать мне никакого представления о том, как решать другие смежные задачи. Но программа, которая находит решение, - это то, что человек может прочитать, интерпретировать и, надеюсь, таким образом генерировать идеи для следующих задач".