xAI представила нейросеть Grok-1.5 Vision (Grok-1.5V), способную работать с изображениями

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Компания Илона Маска xAI представила Grok-1.5 Vision, новую версию нейросети Grok. Инструмент способен обрабатывать не только текст, но и визуальную информацию: фото, скриншоты, диаграммы и многое другое. 

Как сообщает xAI, Grok-1.5V может преобразовать фото блок-схемы в код Python или скриншот таблицы в файл формата CSV. Её можно будет также попросить рассказать сказку по мотивам детского рисунка или объяснить мем.

В xAI заявляют, что эта мультимодальная модель выделяется среди аналогов (GPT-4V, Claude 3Sonnet, Claude 3 Opus и Gemini Pro 1.5) и превосходит конкурентов во многих популярных бенчмарках за счёт использования технологии RealWorldQA. Нейросеть обучили на 700+ изображений, которые сопровождались вопросами и ответами по каждому предмету.

В конце марта xAI выпустила Grok-1.5, способную обрабатывать до 128 000 токенов, что позволяет чат-боту выполнять более сложные запросы и лучше понимать входящие данные.

«[Grok-1.5 способна] использовать информацию из значительно более объёмных документов, — пишет X.ai. — Более того, модель может обрабатывать более сложные запросы, сохраняя при этом способность следовать инструкциям по мере расширения контекстного окна».

В апреле Илон Маск заявил, что для обучения чат-бота Grok 2 использовалось около 20 тысяч графических процессоров Nvidia H100 AI, а новое поколение Grok 3 потребует 100 тысяч GPU.

Источник: https://habr.com/ru/news/807747/


Интересные статьи

Интересные статьи

Журналист ArsTechnica Сэмюэл Аксон решил опробовать возможности гарнитуры дополненной реальности Apple Vision Pro на улицах Чикаго. Он также оценил реакцию других людей.
Apple опубликовала несколько документов, в которых рассказывает о возможном дискомфорте при использовании гарнитуры Vision Pro и том, как с ним бороться.
Microsoft представила серию беспроводных геймпадов Xbox из коллекции Vapor от Xbox Design Lab и контроллер Dream Vapor Special Edition.
Что делать с данными в 2021 году, если вы финансовая компания с традиционной инфраструктурой и не смотрели дальше BI? Как и зачем договариваться разным бизнесам в B2B и ч...
Меня зовут Эдуард Тянтов, я руковожу командой Computer Vision в Mail.ru Group. За несколько лет существования наша команда решила десятки задач компьютерного зрения, и сегодня расскажу вам о ...