Как сделать своего “Марка”? Обучение

Привет, ты уже знаешь, как генерировать новости с помощью Марка. Теперь расскажем, как же так получилось, что мы обучили языковую модель генерации новостей.

Время пришло!

Немного истории

В статье “Тестим Марка: как происходит генерация новостей” ты узнал, что люди придумывают языковые модели, чтобы начать общаться с компьютерами и поддерживать двустороннюю коммуникацию.

Огромную популярность сейчас приобрела модель ChatGPT, потому что она умеет вести диалог с человеком и поддерживать контекст. Но мало кто знает, что эта модель — немного доработанная версия модели GPT-3, которая лежит на hugging face ещё c 2020-ого.

Инфа для тех, кто знает: большинство телеграм-ботов с названием ChatGPT — это не ChatGPT, а GPT-3 c правильной входной формулировкой, потому что ко второй модели доступ сильно проще из-за меньшего потока людей, а генерируют они обе практически одно и то же)

Представляешь, как давно на самом деле существуют такие технологии?

Интересные факты:

GPT-3 пишет эссе о себе самой (проверь дату выпуска статьи и удивись)
Тем, кто думает, что ключевое отличие ChatGPT от GPT-3 в том, что первая умеет вести диалог с пользователем — вот вам видео-интервью, разрушающее эти стереотипы:
GPT-3 не прошла тест Тьюринга в отличие от ChatGPT

Источник: https://habr.com/ru/post/719874/

Вернуться к списку

Интересные статьи

Как из просто хорошей разработки сделать безопасную?

Всем привет! На связи АЭРОДИСК!В этой статье мы расскажем вам про новое направление компании АЭРОДИСК – Цифровое пространство безопасности (ЦПБ). ЦПБ – продукт, созданный для наших партнеров - интегра...

Запиши бит играючи — приложения, которые помогут сделать это

Продолжаем рассказывать о сервисах, позволяющих записать бит и помузицировать в перерыве от работы. Сегодня поговорим о приложениях с элементами геймификации — браузерных играх c атмосферой lo-fi и би...

Как работает кеширование в Bitrix? Всё просто

Данная статья - это не научный прорыв, а лишь помощник быстрее понять как работает стандартный функционал в BitrixДавайте представим, что в разделе каталога у нас 150 запросов к БД. Вроде бы немного п...

Как сделать alter table в высоконагруженной таблице

Ещё лет 5 назад на собеседованиях с backend-разработчиками был популярен вопрос: как переименовать колонку в высоконагруженной таблице (возможны вариации: как сделать любой другой alter table)? Вопрос...

Видеомонтаж, машинное обучение и взломанный xml — все в одной программе

По профессии я режиссер монтажа, а прикладное программирование как увлечение в свободное время.В какой то момент пришла идея совместить работу с хобби, прочитал статью на...