Разговор с директором по ИИ «Яндекс Рекламы» Алексеем Штоколовым о применении ИИ, AI‑тренерах и рутинных задачах

В конце ноября 2023 года информационная служба Хабра сходила на #Reconfa — конференцию «Яндекс Рекламы». Неформат для Хабра, но в этот раз на конференции обсуждалось применение ИИ и нейросетей, поэтому я решил сходить, посмотреть. Об этом есть отдельный материал. Там же мне удалось поймать директора по искусственному интеллекту (ИИ) «Яндекс Рекламы» Алексея Штоколова. Я задал ему несколько вопросов про ИИ и использование его в рекламе. Плавно разговор перетёк в обсуждение профессии AI‑тренера и возможности автоматизации рутинных задач. Приятного чтения!

Как давно ИИ используется в «Яндекс Рекламе»?

Нейросети и искусственный интеллект используется уже лет десять. Наверное, первые наработки были опубликованы в 2014 году. Мы запустили релиз поиска с использованием нейросети. Тогда же мы начали использовать ИИ и нейросети в рекламе.

Вообще, технологии внутри поиска и рекламы взаимосвязаны. Главная задача — дать пользователю наиболее релевантный ответ на его запрос. Многие технологии, используемые в поиске и рекламе, пересекаются. Поэтому нейросети, как прорыв с точки зрения качества в поиске в рекламе, внедрялись почти одновременно. Возможно, была небольшая разница в несколько месяцев, но это было в рамках одного года.

Получается, процессы с использованием ИИ в «Яндекс Рекламе» и «Яндекс Поиске» — одинаковые?

Не совсем. В контекстной рекламе большая часть подбора основана на пользовательском профиле. Эта часть абсолютно уникальна, здесь перед нейросетями стоят более сложные задачи.

Новая нейросеть YandexArt и нейросеть YandexGPT участвуют в новых инструментах «Яндекс Рекламы»? Насколько сильно эти инструменты внедрены?

YandexGPT — это семейство моделей. Внутри «Яндекса» есть несколько итераций разработки. Наружу мы выкладываем большие мажорные изменения, которые действительно заметно влияют на качество, особенно в диалоге, например, с голосовым помощником. Однако у YandexGPT есть постоянные итеративные улучшения. Семейство этих моделей постоянно используется внутри интерфейсов «Яндекс Директа», в первую очередь для создания текста. Эти модели подсказывают варианты заголовков и текстов при создании рекламных объявлений, а где‑то объявление создаётся целиком с помощью искусственного интеллекта: и заголовок, и текст, и картинка.

Основные ИИ‑инструменты для рекламы: первый — это одна из версий YandexGPT, создающая текстовые описания по определённым параметрам (определённый набор символов для ёмкого заголовка, ёмкого описания товара и так далее), и вторая, не связанная с YandexGPT, YandexART. Это нейросеть работает в приложении «Шедеврум», которая создаёт изображения по текстовому описанию. Именно она используется для создания изображений для рекламного объявления без использования фотосъёмки или найма дизайнера.

Если посмотреть чуть глубже, то очень много задач внутри «Яндекс Рекламы» давно решается с помощью нейросетей. Например, классические DSSM (Deep Semantic Similarity Model) и BERT»ы (Bidirectional Encoder Representations from Transformers). Всё ранжирование рекламы построено на нейросетях, но не генеративных, а более классических. Они постоянно дообучаются, и раз в несколько месяцев мы обновляем архитектуры.

Скажите, а API тех версий нейросетей, что вы используете в рекламе, у вас запрашивают?

Если говорить о конкретной модели генеративной сети для наших клиентов, то такого запроса нет. Объясню тут немного подробнее. Под продуктовые задачи нейросеть обучают в два этапа. Первый — это обучение базовой модели, второй — дополнительный файнтюн или дообучение нейросети на конкретную задачу.

API мы даём только базовой технологии. Файнтюн очень специфичная вещь, она сугубо ограничена тем набором требований, которые есть у конкретной задачи. В дообученной модели есть некий набор ограничений на некоторые тематики, более специфичные под запросы наших сервисов («Яндекс Реклама», «Яндекс Бизнес»). Под клиентские запросы эту модель нет смысла отдавать. Лучше предложить базовую модель, а клиент её сам дообучает. Однако запросов на API файнтюненных нейросетей пока не было от клиентов.

Датасеты в ИИ формировались на основе ответов пользователей «Яндекс Толоки» или данные других сервисов тоже используются?

Не совсем. Датасет базовой модели формируется из каких‑то больших объёмов существующих данных, в том числе из открытых источников, но продолжим говорить про дообучение нейросети. Именно стадия файнтюна требует разметки, потому что для супервайз обучения (supervised learning) нужно обучение на примерах. Разметка «Яндекс.Заданий» («ex.Яндекс Толоки») используются, но как один из этапов. Кроме этого этапа есть ещё профи разметка. Она делается руками профессиональных людей, которые этим занимаются — AI‑тренеров.

AI‑тренеры — это в основном специалисты, которые обладают идеальным знанием русского языка и навыками проверки фактов. Но, для того чтобы обучать нейросети под конкретный продукт, нам нужны специалисты в конкретной области. Они должны хорошо знать область примеров, в которых они делают разметку. Потому что с точки зрения качества разметки нужны глубокие знания.

Соответственно, для рекламных задач нужны эксперты в маркетинге, а для задач минералогии нужны эксперты по минералам. Мы недавно с коллегами как раз общались, что некоторые знания про те же минералы невозможно найти просто в открытых источниках. Для них нужен действительно специалист, который в этом разбирается и может искать первоисточники и работать с ними на основе своей экспертизы. С маркетингом и рекламой чуть проще, потому что информации в интернете больше, но просто прочитав и просмотрев обучающие ролики и статьи, экспертом в маркетинге не станешь. Тем более, для качественных ответов нейросети нужен специалист, очень хорошо разбирающийся в маркетинге и хорошо понимающий, какой вариант разметки правильный с точки зрения обучения нейросети.

А у вас большой штат AI‑тренеров? Как я понял из предыдущего ответа, базовое образование у этого специалиста не связано с программированием?

Отвечу сначала на вторую часть вопроса. AI‑тренеры — это не программисты, умение программировать — это скорее вспомогательный скил.

Что касается первой части, обычно на наши задачи AI‑тренеров нанимают на проектную работу. У нас есть задача обучить нейросеть на ответы в определённой области. Мы обращаемся к специалистам в этой области. Для обучения крупной модели нужны сотни крутых специалистов, умеющих создать правильный ответ, простой и полезный для обычного человека.

Я правильно понимаю, что эти специалисты могут не быть AI‑тренерами, но при этом после работы смогут работать как AI‑тренеры?

Да, чаще всего это не готовый тренер‑профессионал. AI‑тренер — это новая профессия. Человеку нужно уметь отдавать свои знания. Они проходят инструктаж‑обучение, учатся правильно интерпретировать инструкцию, с помощью которой надо давать ответ. Потому как сам ответ должен быть ёмким, понятным и не должен содержать термины, которые требуют уточнения. После этого обучения тренер сдаёт микроэкзамен.

Ну и надо понимать, что мы давно применяем разметку данных, как для повышения качества поиска, так и для рекламы и для многих сервисов. Вообще, 90% работы в машинном обучении — это не само машинное обучение, а подготовка данных.

Расскажете, как у вас решаются рутинные задачи? У вас это делает какая‑то платформа или люди? Возможно ли, что когда‑нибудь человек, не разбирающийся в какой‑то области, дал задание нейросети, а она ему дала готовое верное решение?

У нас есть ML‑платформа. Но надо понимать, что не все рутинные процессы автоматизированы. Для ML‑платформы нужно собрать данные, подготовить разметки, запустить процесс обучения и после этого принять метрики. В этом вопросе всегда самое сложное — чтобы модель потом могла оказаться в продакшене и довольно‑таки быстро, потому что иногда люди занимаются обучением несколько месяцев, а после ещё полгода не могут её в продакшн внедрить, потому что это тоже сложный процесс. Поэтому какие‑то этапы автоматизированы.
Например, у нас есть этап сборки обучающих блоков, это поставленный процесс. У нас есть система, которая подготавливает данные и делает это стабильно, потому что для многих моделей «свежесть» данных необходима. Вот такие процессы точно автоматизированы.

Какие‑то более творческие задачи выполняет специалист. Например, feature engineering, когда нужно понять, какие данные правильно складывать в модель. В таких вещах нужны классические подходы. Иногда процессы в этой области частично автоматизированы.

Однако больший труд всё равно лежит на специалисте, знакомым со спецификой задачи. Он должен, в первую очередь, понимать тот продукт, который он делает. Нельзя, как бы мы ни хотели, сделать так — отдал все данные в нейросетку, произошла магия и появилось готовое хорошее решение. Нейросеть решит задачу, но качество получится весьма далёким от понятия «хорошо». Поэтому для обучения нейросетей нужны хорошо размеченные данные и специалисты своего дела.

Исходя из обсуждения я вспомнил крылатую фразу: «Всё новое — это хорошо забытое старое». Не совсем согласен с ней. В случае с AI‑тренерами оказалось, что чем‑то похожим люди занимались ещё до нейросетей. Однако интересно было увидеть, как одна профессия практически трансформировалась в другую. Есть интерес поговорить теперь с действующими AI‑тренерами, чтобы посмотреть внутреннюю «кухню» обучения нейросети. Ну и ещё у меня возник интерес поговорить с людьми, использующими нейросети не в бизнесе, а в науке. Потому что тут обучение ИИ‑модели происходит на не самых распространённых данных.

Источник: https://habr.com/ru/articles/789332/

Вернуться к списку

Интересные статьи

«Яндекс ТВ Станция» и «Яндекс ТВ Станция Про» поступили в продажу

22 августа 2023 года в открытую продажу поступили два новых устройства «Яндекса» с «Алисой»: «Яндекс ТВ Станция» и «Яндекс ТВ Станция Про».

Разговорный английский для онлайн-встреч: 40 полезных фраз

После 2020 года каждый из нас проходил собеседование на работу дистанционно или учился на курсах, и тем более участвовал в онлайн-встречах. Не все из них проходили плодотворно или так, как хотелось бы...

Возможность автоматизации рутинных задач с помощью SCSM + SCO

Любой алгоритмический процесс может быть автоматизирован, обычно для автоматизации рутинных задач пишутся скрипты, которые принимают определённые параметры, делают определённые действия, и возвращают ...

Отбор признаков в задачах машинного обучения. Часть 1

Часто наборы данных, с которыми приходится работать, содержат большое количество признаков, число которых может достигать нескольких сотен и даже тысяч. При построении мо...

БЛА/БПЛА: разрушение восторгов о применении ИИ в БЛА на практике

Последние события выяснения жителей Вилларибо и Виллабаджо, кто самый главный в Нагорном Карабахе, внимательным и любопытствующим телезрителям и читателям сказали довольно много. Даже есл...