Китайская лаборатория представила «рассуждающую» ИИ-модель, которая может стать конкурентом o1 от OpenAI

Китайская лаборатория представила одну из первых моделей искусственного интеллекта (ИИ), способных к «рассуждению», которая, по их словам, может составить конкуренцию o1 от OpenAI.

В среду компания DeepSeek, занимающаяся исследованиями в области ИИ, анонсировала предварительную версию DeepSeek-R1. По заявлению компании, эта модель способна наравне с OpenAI o1-preview выполнять задачи, требующие логического мышления.

Особенности "рассуждающих" моделей

В отличие от большинства существующих ИИ, такие модели могут эффективно «проверять свои выводы», затрачивая больше времени на анализ вопроса или задачи. Это помогает им избегать типичных ошибок, часто возникающих у других моделей.

Как и OpenAI o1, DeepSeek-R1 способен «обдумывать» задачи, строить планы и выполнять последовательность действий для достижения ответа. Этот процесс может занимать десятки секунд в зависимости от сложности запроса.

DeepSeek утверждает, что DeepSeek-R1 (точнее, его версия DeepSeek-R1-Lite-Preview) демонстрирует сопоставимые результаты с o1-preview на двух популярных бенчмарках для ИИ: AIME и MATH. AIME оценивает производительность модели с помощью других ИИ, а MATH представляет собой сборник текстовых задач.

Тем не менее, модель пока не совершенна. Некоторые пользователи в X отметили, что DeepSeek-R1 испытывает трудности с играми на проверку логического мышления, такими как крестики-нолики, — аналогичная проблема наблюдается и у o1.

Уязвимость и цензура

DeepSeek-R1 легко поддается джейлбрейку, то есть может быть «обманута» запросами, которые заставляют игнорировать встроенные ограничения. Один из пользователей X сумел получить от модели подробный рецепт изготовления запрещенных веществ.

Кроме того, DeepSeek-R1 блокирует запросы, связанные с политически чувствительными темами. Например, модель отказалась отвечать на вопросы о китайском лидере Си Цзиньпине, площади Тяньаньмэнь и геополитических последствиях возможного вторжения Китая на Тайвань.

Подобное поведение, скорее всего, объясняется давлением со стороны китайских властей на проекты ИИ в стране. Все модели ИИ в Китае обязаны проходить проверку со стороны регулятора Интернета, чтобы их ответы соответствовали «основным социалистическим ценностям». Более того, сообщается, что правительство предложило создать список источников, запрещенных для обучения моделей. Это приводит к тому, что китайские ИИ часто избегают обсуждения тем, способных вызвать недовольство властей.

Кто стоит за DeepSeek?

DeepSeek, которая планирует открыть исходный код DeepSeek-R1 и предоставить API, является довольно необычной компанией. Она финансируется китайским хедж-фондом High-Flyer Capital Management, использующим ИИ для информирования своих торговых стратегий.

Одна из ранних моделей компании, DeepSeek-V2, способная анализировать текст и изображения, вынудила конкурентов, таких как ByteDance, Baidu и Alibaba, снизить цены на использование своих моделей, а некоторые даже предложили их бесплатно.

Для обучения своих моделей High-Flyer строит собственные серверные кластеры. Последний из них включает 10 000 графических процессоров Nvidia A100 и обошелся компании в 1 миллиард юаней (~138 миллионов долларов).

Основатель High-Flyer, Лян Вэньфэн, выпускник факультета компьютерных наук, ставит перед собой цель достичь создания «сверхразумного» ИИ через проект DeepSeek.

Источник

Источник: https://habr.com/ru/companies/bothub/news/860124/

Вернуться к списку

Интересные статьи

С завода – в IT. История руководителя мобильного направления Битрикс24

Евгений Петриченко пришел в Битрикс24 студентом. За 16 лет в компании он прошел путь от специалиста техподдержки до эксперта по мобильной разработке. И ни разу не думал сменить место работы. ...

Как подготовиться к интервью в YCombinator

Один из первых наборов YC. Когда я готовился к интервью зимнего класса 2018 года, я пересмотрел все доступные источники по теме и провел около 20 практических интервью с выпускниками YComb...

За что, Битрикс? Или сказочный мир 1С

Однажды, в понедельник, мне пришла в голову мысль — "а покопаюсь ка я в новом ядре" (новым относительно, но об этом позже). Мысль не появилась на ровном месте, а предпосылками для нее стали: ...

Настройка скидок в 1С-Битрикс - проблемы и падение производительности

Эта публикация написана после неоднократных обращений как клиентов, так и (к горести моей) партнеров. Темы обращений были разные, но причиной в итоге оказывался один и тот же сценарий, реализу...

Стандартный браузерный API Payment Request

Знаете ли вы о том, что во многих современных браузерах имеется встроенный API, который называется Payment Request? Этот API описан в стандарте W3C, который направлен на поддержку работы с платёж...