VK использовала общедоступный пользовательский контент для создания генеративной нейросети

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

VK разработала свою большую языковую модель (LLM) для генерирования текстов. За основу взяты, в частности, комментарии из открытых групп «ВКонтакте». Первые генеративные функции тестируются в сервисах Mail.ru — почте и календаре, пишет «Ъ».

Издание узнало детали технологии, которая легла в основу объявленных 26 февраля функций генерирования текстов в сервисах продуктивности Mail.ru (почте, календаре, облачном хранилище и заметках). Как пояснили в VK, компания создала для этого собственную LLM, её тренировка проводилась на «открытых корпусах текстов из интернета и публичных данных соцсети „ВКонтакте“ — постах и комментариях в открытых группах».

Собственные LLM уже есть у «Яндекса» (YandexGPT) и «Сбера» (GigaChat), оба внедряют их в свои потребительские продукты и одновременно предлагают доступ к результатам генерации сторонним разработчикам. LLM разработала и структура МТС, MTS AI. С 25 января MTS AI руководит Андрей Калинин, который до сентября 2023 года был вице‑президентом VK по искусственному интеллекту.

Команда разработки ассистента «Маруся», которая «почти полностью пересекается с командой Mail.ru», разрабатывала LLM ещё при Калинине, пояснил знакомый с ситуацией источник «Ъ». Сейчас должность вице‑президента VK по ИИ занимает по совместительству гендиректор «Дзена» Антон Фролов.

По словам собеседника «Ъ», при Калинине подразделения VK изучали перспективы создания LLM независимо: «К наработкам команды „Маруси“ в других бизнес‑юнитах VK относились скептически».

Рутинные задачи, по словам представителя VK, «логично распределить по категориям», поэтому нейросетевые функции тестируются на сервисах продуктивности Mail.ru.

В этой категории, помимо корпоративного мессенджера VK Teams, по госконтракту с Минцифры VK разрабатывает автоматизированное рабочее место госслужащего, объединяющее почту, мессенджер, облачное хранилище и внутренний портал. Решение о дальнейшем использовании LLM примут по результатам тестирования на продуктах Mail.ru, говорят в компании.

В «Яндекс 360» (объединяет аналогичные сервисы, в том числе почту) сообщили, что также «работают в направлении внедрения нейросетей в продукты».

Технически, говорит один из источников «Ъ», VK способна привлечь вычислительные мощности, достаточные для тренировки LLM: «Но это могло быть сопряжено с более серьёзными издержками, чем у „Яндекса“ и „Сбера“. VK — прежде всего контентный бизнес, а не технологический, и до бума ИИ у них не было резона делать сопоставимые вложения в мощности».

Источник: https://habr.com/ru/news/796577/


Интересные статьи

Интересные статьи

Работать с большими Ansible-плейбуком не всегда удобно — в нем трудно читать и переписывать код. В этой статье я поделюсь опытом — расскажу, как «распилила» плейбук на 1000 строк с помощью ChatGPT и...
Платформа TikTok начала продвигать контент с горизонтальным видео продолжительностью более минуты, что делает сервис ещё больше похожим на YouTube. На обновление обратили внимание пользователи TikTok ...
В наше время многочисленные сайты создают страницы, которыми пользователи хотели бы делиться в разных социальных сетях или мессенджерах. Благодаря тегам Open Graph ссылки могут иметь красочное превью ...
Почти всё самое важное, что произошло за неделю в мире финансов как в России, так и в мире: переход Билла Гейтса в режим Джейсона Стэтхема, планы по официальному вводу сюра в Южной Америке, а так...
Меня всегда занимали отказы систем и странности их поведения, в особенности когда те работают в нормальных для себя условиях. Недавно я видел один из слайдов презентации Йена Гудф...