Привет, ты уже знаешь, как генерировать новости с помощью Марка. Теперь расскажем, как же так получилось, что мы обучили языковую модель генерации новостей.
Время пришло!

Немного истории
В статье “Тестим Марка: как происходит генерация новостей” ты узнал, что люди придумывают языковые модели, чтобы начать общаться с компьютерами и поддерживать двустороннюю коммуникацию.
Огромную популярность сейчас приобрела модель ChatGPT, потому что она умеет вести диалог с человеком и поддерживать контекст. Но мало кто знает, что эта модель — немного доработанная версия модели GPT-3, которая лежит на hugging face ещё c 2020-ого.
Инфа для тех, кто знает: большинство телеграм-ботов с названием ChatGPT — это не ChatGPT, а GPT-3 c правильной входной формулировкой, потому что ко второй модели доступ сильно проще из-за меньшего потока людей, а генерируют они обе практически одно и то же)
Представляешь, как давно на самом деле существуют такие технологии?
Интересные факты:
GPT-3 пишет эссе о себе самой (проверь дату выпуска статьи и удивись)
Тем, кто думает, что ключевое отличие ChatGPT от GPT-3 в том, что первая умеет вести диалог с пользователем — вот вам видео-интервью, разрушающее эти стереотипы:
GPT-3 не прошла тест Тьюринга в отличие от ChatGPT