А пруф есть? GigaSearch научился указывать ссылки на источники информации

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.
Пример указания источников информации в GigaChat
Пример указания источников информации в GigaChat

Cегодня для всех пользователей GigaChat Web мы выпустили новую фичу — ссылки на источник. Самым сложным при реализации этой функции было обучить GigaChat генерировать специальные маркеры, указывая таким образом, на основе какого источника сгенерирована та или другая часть ответа.

Кому интересно, как мы это сделали, добро пожаловать под кат.

Что такое GigaSearch?

GigaSearch — это система генерации ответа на основе поисковой выдачи, она бесшовно включается для пользователя, когда необходимо дать фактологически точный ответ. Кстати, рекомендуем к прочтению нашу недавнюю статью про эту технологию. Такой подход в англоязычной литературе называется RAG (Retrieval-Augmented Generation), он позволяет LLM использовать внешние данные. Про использование подхода также недавно рассказывали в OpenAI.

Зачем давать ссылки на источники?

Есть несколько целей, которые мы преследовали при реализации этой функциональности. Во-первых, теперь пользователь может проверить корректность ответа, кликнув по ссылке и перейдя на первоисточник, если его по той или иной причине смущает ответ LLM.

Кликнув по ссылке, можно перейти на источник информации
Кликнув по ссылке, можно перейти на источник информации

Во-вторых, это позволяет пользователю получить больше информации, при желании воспользовавшись ссылками.

Согласитесь — приятный бонус по сравнению с чисто текстовым ответом.

Дообучаем GigaChat возвращать источники

Теперь о самом интересном. Напоминаю, что GigaSearch работает по простой схеме: мы подкладываем в промпт GigaChat-а документы, которые релевантны запросу пользователя.

Дальше нам предстояло научить GigaChat сообщать, какие из предоставленных документов он использовал в ответе, а какие нет. Для этого мы собрали датасет пар запросов и ответов, к тому же в каждом ответе специальными маркерами SOURCES[X] указаны использованные источники. Пример такой пары ниже:

Пример запроса в GigaChat с промптом GigaSearch
Пример запроса в GigaChat с промптом GigaSearch
Пример ответа GigaChat-а с указанием источников
Пример ответа GigaChat-а с указанием источников

Каждая пара была провалидирована с помощью разметчиков на корректность ответа и ссылок. Далее, все корректные пары были добавлены в SFT (Supervised Fine-Tuning) датасет GigaChat-а. Напомню, SFT — это второй этап обучения LLM, первый — предобучение (pretrain). На втором этапе модель обучают следовать инструкциям.

После обучения GigaChat-а осталось лишь написать простой парсер, который будет вырезать из ответа спецстроки SOURCES[X] и передавать их позиции и индекс X в UI.

Попробуем?

Кому интересно — можно самим попробовать GigaSearch со ссылками в GigaChat Web. Чтобы появились ссылки, нужно задать фактологический вопрос, например:

Пример фактологического запроса и ответа GigaChat
Пример фактологического запроса и ответа GigaChat

Что дальше?

Мы планируем улучшать формат и качество работы ссылок на источники, а также GigaSearch в целом. В этой задаче нам максимально поможет ваше мнение, идеи и отзывы! Пообщаться с нами можно в комментариях Telegram-канала Salute AI или напрямую в нашем сообществе Salute AI Community.

Источник: https://habr.com/ru/companies/sberbank/news/780728/


Интересные статьи

Интересные статьи

Привет, Хабр!Мы решили проанализировать известные утечки из российских компаний за первое полугодие 2023, о которых писали СМИ и Телеграм-каналы (@dataleak, @data1eaks, @in4security, @intosecurity), ч...
В нашей компании принято устраивать звонки-знакомства — на них клиенты могут напрямую пообщаться с командами, которые будут им помогать или сопровождать. Во время таких встреч поднимается множество во...
Пару лет назад я пришел к выводу, что нынешний общественный строй в технически развитых странах нужно называть бюрократическим социализмом. Но человечество развивается стремительно; соц...
Решили рассказать историю одной международной компании, которая имеет 11 производственных площадок в России. В силу такой территориальной рассредоточенности топ-менеджмент проводит до 90% времени в ко...
… и оно научило меня довольно полезным навыкам. До сих пор помню первую строку кода, которую мне довелось изменить: я увеличил единственное значение integer, чтобы сделать больше диа...