Конец эры поисковиков? ChatGPT заменит Google?

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Google и любой другой поисковик — это инструмент, благодаря которому вы наткнулись на эту статью. Возможно, вы искали информацию по ключевым словам «ChatGPT» или «OpenAI». Возможно, статья появилась в рекомендованных, потому что вы в последнее время много искали про ИИ и нейросети. Как бы то ни было, теперь вы здесь, и это благодаря поисковику.

За более чем два десятилетия Google стал королём поисковиков. Google коренным образом изменил Интернет и способ доступа к информации. Сегодня на его долю приходится 9 из 10 поисковых запросов в Интернете, и он используется по умолчанию практически на любом устройстве с доступом в Интернет в большинстве стран мира. Исключение разве что Baidu — самая популярная поисковая система в Китае, где Google запрещён.

Нужно перевести текст с английского? Словарь не требуется; Гугл в помощь! Хотите узнать, с кем встречается Киану Ривз? Спросите у Гугла! Где лучшие рестораны поблизости? В Гугле найдёте инфу. Ищете новые наушники? Просто “погуглите”. Превосходство Гугл привело к тому, что он превратился из простого поискового робота в глагол; всезнающая сущность сама по себе.

Прогнозы о его свержении и скорой смерти делались регулярно, а Google лишь становился сильнее. Но когда с ноября 2022 года начали постоянно появляться новости про ChatGPT от OpenAI, что-то изменилось. Эксперты снова начали задаваться вопросом: «это конец Google?»

ChatGPT vs Google


Процесс поиска в Google — артефакт раннего Интернета, когда поисковые системы работали как цифровые картотечные шкафы. Они не приводили пользователя прямо к ответу, но подводили к нужному «шкафу» с данными. По мере своего развития они стали лучше направлять по правильному пути — пользователи находили ответы быстрее — но на многие вопросы по-прежнему подают «стопку папок» в виде ссылок, чтобы пользователь дальше искал ответ самостоятельно. А пользователи ищут не ссылки, пользователи ищут готовые ответы. Так уж мы устроены: вместо того, чтобы идти в супермаркет и собирать из разных отделов продукты и самим готовить еду, мы хотим готовое блюдо из ресторана. По сути, именно поэтому ChatGPT и новые поисковые системы чат-ботов так впечатляют. Они дают пользователям немедленный готовый ответ с дата-анализом.

Ведь пользователям нужна информация быстро. Им нужна информация заслуживающая доверия. Интернет, в котором будут преобладать диалоговые, генеративные поисковые системы с искусственным интеллектом, может давать ответы с большей скоростью и готовностью. Но можно ли доверять таким ответам? Вопрос остаётся открытым.

Это не означает, что пользователи откажутся от Google Search. Ведь кто-то любит готовить еду сам. И поэтому вероятность, что скоро мы откажемся от Google из-за роста поисковых систем чат-ботов за последние несколько месяцев, остаётся весьма сомнительной. Несмотря на то, что nu-Search резко меняет способ доступа человечества к информации, кажется преждевременным предполагать, что какой-либо из этих инструментов ИИ готов к использованию массово.



ChatGPT не собирается заменять Google в ближайшее время. Не потому, что ChatGPT не может получить доступ в Интернет, или ему не хватает информации. Причина, по которой он не заменит Google, заключается в том, что он отличается от Google. Архитектурная точка зрения, используемая для обслуживания сервисов, подобных Google, требует другого набора вариантов, чем тот, который используется в ChatGPT.

Назначение ChatGPT (его предка GPT и его потомка GPT-4) состоит в том, чтобы генерировать новую информацию как ответ на основе запроса и контекста диалога. Целью поисковика является предоставление информации на основе введённых ключевых слов. Он не генерирует никакой информации сам по себе.

ChatGPT не Google


Однако, чтобы лучше ответить на вопрос, необходимо вникнуть (хотя бы поверхностно) в то, как работают Google и ChatGPT.


Гугл — это робот-поисковик в сочетании с огромным индексом базы данных. И этот показатель постоянно растёт. Веб-краулер периодически просматривает всемирную паутину и пополняет новыми URL-адресами свою БД. Благодаря своему знаменитому базовому алгоритму под названием Pagerank, Гугл сортирует страницы, чтобы отображать наиболее релевантные результаты. Среди миллиарда веб-страниц, которые Google почти подхватил, выживают лишь немногие счастливчики. Это те, у которых правильная плотность ключевых слов, безобидный контент (согласно рекомендациям Google), отсутствие дублирования (т.е. плагиата) и ряд других критериев достоверности. Затем PageRank обрабатывает страницы, используя различные оценки, типа обратных ссылок.

За последнее десятилетие Google ввёл обязательные требования (такие как стандартизация DOM, время загрузки страницы и т. д.) для удобства поиска. Страница, которая имеет наивысший балл по всем фильтрам, помещается вверху списка. Это относится только к органическим результатам поиска. Когда веб-мастер платит Google за определённые ключевые слова, веб-сайт получает первое место, если пользователь соответствует демографическим данным кампании, а бюджет веб-мастера не исчерпан.

Приведённое выше объяснение является очень упрощённым. Со временем исходный алгоритм Google не только изменился, но и получил некоторые нюансы понимания естественного языка на основе искусственного интеллекта и генерации. Например, поиск Google с его моделью искусственного интеллекта MUM может определить, пытается ли ищущий пользователь найти способы совершить самоубийство (осуждаем!), и может предложить психологическую помощь вместо выполнения его/её запроса.

Как работает ChatGPT

Любая языковая модель ИИ построена по типу: известные входные данные -> известные выходные данные. Вот как ИИ выводит свои правила. Например:

x=3 -> y=9
x=4 -> y=16
x=5 -> y=25


В конце концов, модели ИИ не потребуется много времени, чтобы понять, что:

у=х^2


Это мало чем отличается от дрессировки собаки приносить мяч (вознаграждая её вкусняшкой), но не палку (наказывая той же палкой (снова осуждаем!)).

Чат-бот на основе ИИ на высоком уровне содержит следующее:

Парсер

С помощью токенизации делается разделение предложений на глаголы, существительные, объекты и предметы.

Анализатор настроений

В зависимости от порядка слов наличие таких символов, как «!» и «?», а также других тональных индикаторов, анализатор настроений обычно выдаёт оценку положительных или отрицательных эмоций.

Цикл обратной связи

Во время обучения модели чат-бота создатели сигнала вводят в неё известный текст и помечают ожидаемый результат как правильный/неправильный.

Например, предположим, что модель данных имеет 3 входа:

«Петя сердито съел банан» (подлежащее=Петя, глагол=есть, объект=банан)
«Женя поспешно пробежала спринт» (подлежащее=Женя, глагол=бегать, объект=спринт)
«Слон бережно спас ребёнка» (подлежащее=слон, глагол=спасать, объект=ребёнок)

После подачи достаточного количества входных данных, модель будет достаточно знать о структуре предложений. При запросе модель выдаёт желаемый результат в зависимости от требования. (Например, «Женя спасла банан» — прикольно, но не неправильно, судя по построению предложений, которое модель выучила.)

Чем больше входных данных подается на модель, тем мощнее становится модель. Соответственно, работа с ней также становится дорогостоящей в вычислительном отношении. Бесплатная бета-версия ChatGPT обходится OpenAI в 3 миллиона долларов в месяц, что скоро превратится в миллиарды в месяц.

Генерация естественного языка (NLG)

Это относительно проще, так как состоит из тех же языковых правил, которые вводились ранее. На этот раз модель генерирует содержимое ответа. Всё, что ей нужно, это правильный словарь или любой другой источник языкового репозитория, например, научные журналы и т.п. Важной частью фазы NLG является правильное управление настроениями. Например, ИИ не должен выдавать гневный вывод в ответ на гневный ввод пользователя и так далее. Он также должен быть свободен от предубеждений дискриминации.

Сила ChatGPT заключается в его понимании человеческого языка и генерации ответа на основе миллионов страниц текстового контента. ChatGPT обучен более чем 175 миллиардам параметров, что означает, что он обладает широкими возможностями для обработки широкого спектра лингвистических входных данных. В результате он знает содержание исследовательских работ и обширной литературы, может делать выводы об их значении, а также может писать рассказы и стихи. Но Google Search (поиск, фильтрация, ранжирование и представление) — это не то же самое, что интерпретация — задача, с которой ChatGPT хорошо справляется.

Если они такие разные, то почему все спрашивают о замене Google ChatGPT? Вопрос о заменяемости Гугл возник из-за его собственных действий. Чтобы использовать своё доминирующее положение и отвечать на любые вопросы, Google стал встраивать контент с форумов (Quora), новостных и образовательных сайтов, Википедии и своей любимой дочерней платформы — YouTube. И пользователи начали подсознательно юзать Гугл в качестве импровизированного чат-бота. Этому способствовало его глубокое проникновение в жизнь пользователей через Android, дефолтные настройки (Google по умолчанию используется как в iOS, так и в Android) и приложения Gmail.

Именно в этом смысле многие считают, что ChatGPT угрожает существованию Google. С его долей рынка поиск Google не сталкивается с какой-либо непосредственной угрозой. Это также связано с его огромным набором данных о поведении пользователей и исследованиях. Благодаря надёжной технологической базе он может развиваться с максимальной маневренностью.

ChatGPT и Bing


Несмотря на то, что ChatGPT не собирается заменять Google, с появлением генеративного поискового чат-бота на основе ИИ, в текущем десятилетии ситуация всё-таки изменится. Изменения затронут не просто поиск информации в Интернете. Они затронут то, как мы взаимодействуем со всеми интеллектуальными устройствами в нашей жизни. ChatGPT показывает нам новый способ взаимодействия с Интернетом. Изменения уже происходят.

А совсем недавно хакер взломал ChatGPT API, и обнаружил ещё недоступные новые плагины (более 80 штук). Будем ждать их релиза, посмотрим на что они способны и как это всё повлияет на дальнейшее развитие.



ChatGPT в итоге найдёт своё применение в Bing. После поражения Microsoft в 2000-х годах, Google побеждает на всех платформах — отчасти благодаря его гегемонии с Apple (Apple позволяет ему быть поисковой системой по умолчанию на iOS). Microsoft объявила о своём Bing с поддержкой искусственного интеллекта 7 февраля 2023 года. Google представил Bard, своего конкурента ChatGPT, всего за день до мероприятия Microsoft. Это событие было провозглашено началом «Войны поисковых чат-ботов». Возможно, Bing наконец проникнет в королевство Google и может даже убить финального босса.

Представители Google и Microsoft признают, что возможности искусственного интеллекта пока недоступны для общественности и не будут выпущены до тех пор, пока они не будут соответствовать высоким стандартам качества и безопасности.

Источник: https://habr.com/ru/companies/mvideo/articles/729704/


Интересные статьи

Интересные статьи

Много лет я занимаюсь разработкой событийной семантики [1, 2], событийной логики [3], спецификации языка описания деятельности, а также Event Flow архитектуры [4], на базе которой построен семантическ...
Привет, Хабр!Языковая модель ChatGPT произвела настоящий фурор. Даже Хабр в последние недели пестрит статьями про неё. Получив доступ к этой модели, я захотел изучить её способность шутить. Научить ИИ...
Очевидно, что  ChatGPT иллюстрирует очень существенный прорыв в возможностях технологий искусственного интеллекта (ТИИ). Он, его ближайшие аналоги и производные вкупе с параллельно развивающимися...
Доброго времени суток, хабражители! Меня зовут Димитрий Зуйков, и я из TrueConf. Нас тут уже много, мы рассказываем о продуктах компании, и что важнее – о подходах к их развитию. Мы отлично понимаем п...
Micronaut ворвался в нашу жизнь внезапно, без стука и без объявления войны. О нем пишут новости и читают доклады, и вряд ли найдется джавист, который ни разу не слышал это слово. Mi...