Искусственный интеллект означает конец поиска в Интернете в том виде, в каком мы его знали

Несмотря на меньшее количество кликов, споры об авторских правах и иногда сомнительные ответы, ИИ может открыть новые способы получения всех мировых знаний. Перевод статьи Мэта Хонана, опубликованной 6 Января 2025 года в MIT Technology Review

George Wylesol

Мы все знаем, что в разговорной речи означает «погуглить что-то». Вы вводите несколько релевантных слов в поисковую строку и в ответ получаете список синих ссылок на наиболее подходящие результаты. Возможно, вверху есть краткие пояснения. Возможно, карты, спортивные результаты или видео. Но по сути это просто поиск информации, которая уже есть в интернете, и её структурированное представление.

Но всё это можно получить. Мы находимся на новом переломном этапе.

Самое большое изменение в том, как поисковые системы предоставляют нам информацию с 1990-х годов, происходит прямо сейчас. Больше никакого поиска по ключевым словам. Больше никакой сортировки ссылок для перехода по ним. Вместо этого мы вступаем в эпоху диалогового поиска. Это означает, что вместо ключевых слов вы используете реальные вопросы, сформулированные на естественном языке. А вместо ссылок вы всё чаще будете получать ответы, написанные генеративным искусственным интеллектом на основе актуальной информации со всего интернета, представленной таким же образом.

Конечно, Google — компания, которая определяла поисковую индустрию на протяжении последних 25 лет, — пытается лидировать в этой сфере. В мае 2023 года она начала тестировать ответы на поисковые запросы, сгенерированные искусственным интеллектом, используя свою большую языковую модель (LLM) для предоставления ответов, которые можно было бы ожидать от эксперта или надёжного друга. Она называет их «обзорами ИИ». Генеральный директор Google Сундар Пичаи назвал это MIT Technology Review «одним из самых положительных изменений, которые мы внесли в поиск за долгое-долгое время».

Обзоры искусственного интеллекта в корне меняют типы запросов, которые может выполнять Google. Теперь вы можете задавать ему вопросы типа “Я собираюсь в Японию на неделю в следующем месяце. Я останусь в Токио, но хотел бы совершить несколько однодневных поездок. Проходят ли поблизости какие-нибудь фестивали? Как обстоят дела с серфингом в Камакуре? Играют ли там какие-нибудь хорошие группы?” И вы получите ответ — не просто ссылку на Reddit, а готовый ответ с текущими результатами.

Более того, вы можете выполнять поиск, который раньше был практически невозможен, и получать правильные ответы. Вам не нужно уметь формулировать, что именно вы ищете. Вы можете описать, как выглядит птица у вас во дворе, или в чём проблема с вашим холодильником, или странный шум, который издаёт ваша машина, и получить почти человеческое объяснение, составленное из источников, которые раньше были разрознены по всему интернету. Это удивительно, и как только вы начнёте так искать, это вызовет привыкание.

И это не только Google. ChatGPT от OpenAI теперь имеет доступ к интернету, что позволяет ему гораздо лучше находить актуальные ответы на ваши запросы. В сентябре Microsoft выпустила генеративные результаты поиска для Bing. У Meta есть собственная версия. Стартап Perplexity делал то же самое, но с девизом «действуй быстро, ломай вещи». На кону стоят буквально триллионы долларов, поскольку эти игроки борются за то, чтобы стать следующим источником информации — следующим Google.

Не все в восторге от этих изменений. Издатели в полном ужасе. Этот сдвиг усилил опасения по поводу «нулевого клика» в будущем, когда поисковый реферальный трафик — основа интернета ещё до появления Google — исчезнет.

Я увидел это будущее в июне прошлого года, когда получил push-уведомление от приложения Perplexity на своём телефоне. Perplexity — это стартап, который пытается переосмыслить веб-поиск. Но помимо предоставления подробных ответов на запросы, он будет создавать целые статьи о новостях дня, собранные искусственным интеллектом из разных источников.

В тот день мне на почту пришла статья о новой компании по производству дронов от Эрика Шмидта. Я узнал эту статью. Forbes уже публиковал её ранее на этой неделе, но она была закрыта для бесплатного просмотра. Изображение в статье Perplexity выглядело так же, как в Forbes. Язык и структура были очень похожи. По сути, это была та же статья, но доступная в интернете бесплатно. Я написал другу, который редактировал оригинальную статью, чтобы спросить, заключил ли Forbes сделку со стартапом о повторной публикации его контента. Но сделки не было. Он был потрясен, взбешен и, ну, в общем, сбит с толку. Он был не один. Forbes, New York Times и Condé Nast уже направили компании приказы о прекращении деятельности. News Corp подает в суд на возмещение ущерба.

Люди обеспокоены тем, что эти новые результаты, полученные с помощью LLM, будут означать для нашей фундаментальной общей реальности. Это может означать конец канонического ответа.

Это был именно тот кошмарный сценарий, которого так боялись издатели: ИИ поглощал их премиум-контент, переупаковывал его и продвигал среди своей аудитории таким образом, что у пользователей не было причин переходить по ссылкам на оригинал. На самом деле, на странице Perplexity «О нас» первой причиной, по которой стоит выбрать эту поисковую систему, является «Пропустить ссылки».

Но дело не только в издателях (или в моих собственных интересах).

Люди также обеспокоены тем, что эти новые результаты, полученные с помощью LLM, будут означать для нашей фундаментальной общей реальности. Языковые модели имеют тенденцию выдумывать что-то — они могут галлюцинировать и нести чушь. Более того, генеративный ИИ может каждый раз давать совершенно новый ответ на один и тот же вопрос или давать разные ответы разным людям на основе того, что он о них знает. Это может означать конец канонического ответа.

Но не заблуждайтесь: это будущее поиска. Попробуйте сами, и вы увидите.

Конечно, мы всегда будем пользоваться поисковыми системами, чтобы перемещаться по интернету и находить новые и интересные источники информации. Но ссылки уходят на второй план. То, как ИИ может составить обоснованный ответ практически на любой вопрос, опираясь на данные из интернета в режиме реального времени, просто делает работу лучше. Это особенно заметно по сравнению с тем, чем стал поиск в интернете в последние годы. Если он и не совсем сломан (данные показывают, что люди ищут в Google чаще, чем когда-либо прежде), то, по крайней мере, он становится всё более перегруженным и сложным для навигации.

Кому хочется говорить на языке поисковых систем, чтобы найти то, что нужно? Кому хочется переходить по ссылкам, когда можно получить прямые ответы? И, может быть, кому хочется учиться, когда можно просто знать?

В начале был Арчи. Это была первая настоящая поисковая система в интернете, которая сканировала файлы, ранее скрытые во тьме удалённых серверов. Она не сообщала, что было в этих файлах, — только их названия. Она не показывала изображения; у неё не было иерархии результатов или даже полноценного интерфейса. Но это было началом. И это было неплохо.

Затем Тим Бернерс-Ли создал Всемирную паутину, и появились всевозможные веб-страницы. Домашняя страница Mosaic, база данных фильмов в интернете, Geocities, «Хэмпстерский танец», веб-кольца, Salon, eBay, CNN, сайты федеральных органов власти и домашняя страница какого-то парня в Турции.

В конце концов, в интернете стало слишком много информации, чтобы понять, с чего начать. Нам действительно нужен был лучший способ ориентироваться в нём, чтобы находить то, что нам нужно.

И вот в 1994 году Джерри Янг создал Yahoo — иерархический каталог веб-сайтов. Он быстро стал домашней страницей для миллионов людей. И это было… ну, это было нормально. Честно говоря, оглядываясь назад, я думаю, что тогда мы все считали, что это было намного лучше, чем на самом деле.

Но Интернет продолжал расти, разрастаться и расширяться, с каждым днём предоставляя всё больше информации. Вместо простого списка сайтов по категориям нам нужно было что-то, что действительно просматривало весь этот контент и индексировало его. К концу 1990-х годов это означало выбор из множества поисковых систем: AltaVista, AlltheWeb, WebCrawler и HotBot. И они были хороши — огромное улучшение. По крайней мере, поначалу.

Но вместе с появлением поисковых систем появились и первые попытки использовать их возможности для привлечения трафика. Дорогого, ценного трафика, на который веб-издатели полагаются при продаже рекламы, а розничные продавцы используют для привлечения внимания к своим товарам. Иногда это означало наполнение страниц ключевыми словами или бессмысленным текстом, предназначенным исключительно для того, чтобы продвинуть страницы выше в результатах поиска. Это было довольно плохо.

А потом появился Google. Трудно переоценить революционность Google, когда он был запущен в 1998 году. Вместо того чтобы просто сканировать контент, он также анализировал источники, ссылающиеся на веб-сайт, что помогало оценить его релевантность. Если упростить: чем чаще что-то цитировалось в других местах, тем более надёжным Google считал это и тем выше оно появлялось в результатах поиска. Этот прорыв позволил Google значительно лучше находить релевантные результаты, чем всё, что было до него. Это было потрясающе.

В течение 25 лет Google доминировал в сфере поиска. Для большинства людей Google был поисковиком. (Масштабы этого доминирования в настоящее время являются предметом многочисленных судебных разбирательств в США и Европейском союзе.)

Но Google уже давно отошёл от простого предоставления серии синих ссылок, отмечает Панду Наяк, главный научный сотрудник Google в области поиска.

«Это не просто так называемые веб-результаты, но есть изображения и видео, а также специальные материалы для новостей. Есть прямые ответы, ответы из словарей, ответы о спорте, ответы, которые приходят с помощью Knowledge Graph, такие как избранные фрагменты», — говорит он, перечисляя шаги, которые Google предпринимал на протяжении многих лет, чтобы отвечать на вопросы более прямо.

Это правда: Google со временем эволюционировал, становясь всё более похожим на портал с ответами. Он добавил инструменты, которые позволяют людям просто получать ответы — счёт игры в реальном времени, часы работы кафе или фрагмент с сайта Управления по санитарному надзору за качеством пищевых продуктов и медикаментов, — а не переходить на сайт, где может быть ответ.

Но как только вы немного поработаете с AI Overviews, вы поймёте, что они отличаются.

Возьмём избранные фрагменты — отрывки, которые Google иногда выделяет и показывает в верхней части результатов поиска. Эти слова взяты непосредственно из первоисточника. То же самое относится к панелям знаний, которые создаются на основе информации, хранящейся в ряде общедоступных баз данных и в Knowledge Graph Google — базе данных, содержащей триллионы фактов о мире.

Хотя они могут быть неточными, источник информации известен (и его можно исправить). Он находится в базе данных. Вы можете его найти. Больше не нужно: обзоры ИИ могут каждый раз быть совершенно новыми, генерироваться на лету с помощью языковой модели, предсказывающей текст, в сочетании с индексом Интернета.

«Я думаю, что это захватывающий момент, когда мы, очевидно, проиндексировали весь мир. Мы создали глубокое понимание на основе этого с помощью Graph of Knowledge. Мы использовали большие языковые модели и генеративный искусственный интеллект, чтобы улучшить наше понимание всего этого, — сказал Пичаи в интервью MIT Technology Review. — Но теперь мы можем генерировать и компоновать с помощью этого».

В результате это похоже не столько на запрос в базе данных, сколько на вопрос, заданный очень умному, начитанному другу. (С оговоркой, что друг иногда будет придумывать что-то, если не знает ответа.)

«[Миссия компании] — систематизировать информацию в мире, — рассказывает мне Лиз Рейд, глава отдела поиска Google, из штаб-квартиры в Маунтин-Вью, Калифорния. — Но на самом деле какое-то время мы занимались систематизацией веб-страниц. Это не совсем то же самое, что систематизировать информацию в мире или сделать её по-настоящему полезной и доступной для вас».

Вторая концепция — доступность — это то, что Google действительно использует в обзорах искусственного интеллекта. Это мнение я неоднократно слышал в разговорах с руководителями Google: они могут более эффективно решать более сложные типы запросов, используя языковую модель, которая помогает давать ответы. И они могут делать это на естественном языке.

Это станет еще более важным в будущем, когда поиск выйдет за рамки текстовых запросов. Например, Google Lens, который позволяет людям сфотографировать или загрузить изображение, чтобы узнать о чем-то больше, использует сгенерированные искусственным интеллектом ответы, чтобы сообщить вам, на что вы, возможно, смотрите. Google даже продемонстрировал возможность запрашивать видео в реальном времени.

Если у модели ИИ нет ответа, она всё равно может уверенно выдать ответ. Для Google это может стать настоящей проблемой. Для остальных это может быть опасно.

«Мы определённо находимся в начале пути, на котором люди смогут задавать и получать ответы на гораздо более сложные вопросы, чем те, которые мы задавали в прошлом десятилетии», — говорит Пичаи.

Здесь есть несколько реальных опасностей. Во-первых, большие языковые модели будут вам лгать. У них бывают галлюцинации. Они всё делают не так. Если у модели ИИ нет ответа, она всё равно может беспечно и уверенно выдать ответ. Для Google, который за последние 20 лет построил свою репутацию на надёжности, это может стать настоящей проблемой. Для всех остальных это может быть опасно.

В мае 2024 года ИИ-обозреватели были доступны всем в США. Всё пошло не так, как планировалось. Google, долгое время служивший мировым справочным бюро, советовал людям есть камни и мазать пиццу клеем. Эти ответы были в основном реакцией на то, что компания называет «провокационными запросами» — запросами, призванными вывести её из строя. Но всё же. Это выглядело не очень хорошо. Компания быстро приступила к устранению проблем — например, отказавшись от так называемого пользовательского контента с таких сайтов, как Reddit, откуда поступали самые странные ответы.

Однако, несмотря на то, что все внимание было приковано к ошибкам, из-за которых людям советовали есть камни, более серьёзная опасность может возникнуть, когда что-то пойдёт не так, но не так очевидно. Например, когда я готовил эту статью, я спросил Google, когда MIT Technology Review появился в интернете. Он любезно ответил, что «MIT Technology Review начал своё онлайн-присутствие в конце 2022 года». Для меня это было очевидно неверно, но для человека, совершенно незнакомого с этим изданием, заметна ли была бы ошибка?

Я наткнулся на несколько подобных примеров как в Google, так и в поиске ChatGPT от OpenAI. Это достаточно далеко от истины, чтобы не восприниматься сразу как что-то неверное. Google рассчитывает, что со временем сможет улучшить эти результаты, опираясь на свои знания о качественных источниках.

«Когда мы создаём обзоры ИИ, — говорит Наяк, — мы ищем подтверждающую информацию в результатах поиска, и сами результаты поиска по возможности берутся из надёжных источников. Это некоторые из имеющихся у нас механизмов, которые гарантируют, что если вы просто воспользуетесь обзором ИИ и не захотите искать дальше… мы надеемся, что вы всё равно получите надёжный, заслуживающий доверия ответ».

В приведённом выше примере ответ 2022 года, по-видимому, был получен из надёжного источника — статьи о рассылке электронных писем MIT Technology Review, которая появилась в 2022 году. Но машина в корне неверно истолковала информацию. Это одна из причин, по которой Google использует людей — оценщиков — для проверки точности результатов. Оценки не исправляют и не контролируют отдельные обзоры ИИ; скорее, они помогают обучить модель давать более качественные ответы. Но люди-оценщики могут ошибаться. Google работает и над этим.

«Эксперты, которые смотрят ваши эксперименты, могут не заметить галлюцинацию, потому что она кажется естественной, — говорит Наяк. — Поэтому вам нужно тщательно продумать систему оценки, чтобы убедиться, что при возникновении галлюцинации кто-то сможет указать на неё и сказать: «Это проблема».

Новый поиск

Google предоставил доступ к своим обзорам ИИ более чем миллиарду человек в более чем 100 странах, но сталкивается с конкурентами, у которых есть новые идеи о том, как должен работать поиск.

Google. Поисковый гигант добавил в результаты поиска обзоры на основе ИИ. Эти обзоры собирают информацию из интернета и из «Графа знаний» Google и используют языковую модель Gemini для создания ответов на поисковые запросы.

С помощью ИИ-обозревателей Google можно легко составить понятную сводку в ответ даже на самые сложные запросы, а рядом с ответами будут указаны источники. Среди основных опций наиболее «интернетовским» кажется индекс глубокой веб-паутины. Но веб-издатели опасаются, что из-за таких сводок людям не захочется переходить по ссылкам на исходный материал.

Perplexity. Perplexity — это диалоговая поисковая система, которая использует сторонние большие языковые модели от OpenAI и Anthropic для ответов на запросы.

Perplexity отлично справляется с более глубокими исследованиями в ответ на запросы пользователей, предоставляя ответы, похожие на мини-аналитические записки по сложным темам. Он также отлично подходит для подведения итогов текущих событий. Но у него плохая репутация среди издателей, которые говорят, что он вольно обращается с их контентом.

ChatGPT. В то время как Google внедрил ИИ в поиск, OpenAI внедрил поиск в ChatGPT. Запросы, которые, по мнению модели, выиграют от веб-поиска, автоматически запускают его, или пользователи могут вручную выбрать опцию добавления веб-поиска.

Благодаря своей способности сохранять контекст в ходе беседы, ChatGPT хорошо подходит для выполнения поисковых запросов, которые требуют дополнительных вопросов, например, для планирования отпуска с помощью нескольких поисковых запросов. OpenAI сообщает, что пользователи иногда «заходят вглубь» на 20 шагов при поиске ответов на запросы. Из этих трёх вариантов ссылки на издателей наименее заметны.

Когда я говорил об этом с Пичаи, он выразил оптимизм по поводу способности компании поддерживать точность даже при том, что LLM генерирует ответы. Это связано с тем, что AI Overviews основан на флагманской крупной языковой модели Google Gemini, но также опирается на Knowledge Graph и то, что компания считает авторитетными источниками в Интернете.

«Вы всегда имеете дело с процентами. То, что мы сделали, — это обеспечило то, что я бы назвал несколькими девятками доверия, достоверности и качества. Я бы сказал, 99 с небольшим процентами. Я думаю, что это та планка, на которой мы работаем, и это справедливо и для AI Overviews, — говорит он. — И поэтому возникает вопрос: сможем ли мы сделать это снова в больших масштабах? И я думаю, что сможем».

Однако есть и другая опасность: люди спрашивают у Google всякие странные вещи. Если вы хотите узнать чьи-то самые тёмные секреты, посмотрите на историю поиска. Иногда люди спрашивают у Google о чём-то очень мрачном. Иногда это незаконно. Google должен не просто использовать свои обзоры ИИ, когда ответ может быть полезным; он должен быть очень осторожен и не использовать их, когда ответ может быть вредным.

«Если вы зададите вопрос «Как мне сделать бомбу?», то в интернете вы найдёте ответы. Это открытый интернет. Вы можете получить доступ к чему угодно, — говорит Рид. — Но нам не нужен обзор ИИ, в котором рассказывается, как сделать бомбу, верно? Мы просто не считаем, что это того стоит».

Но, возможно, самая большая опасность — или самое большое неизвестное — подстерегает тех, кто находится ниже по цепочке поиска Google. Возьмём, к примеру, издателей, которые на протяжении десятилетий полагались на поисковые запросы, чтобы направлять людей к себе. Зачем людям переходить по ссылке на исходный источник, если вся нужная им информация есть в результатах поиска?

Рэнд Фишкин, соучредитель исследовательской компании SparkToro, занимающейся исследованиями рынка, публикует исследование так называемых поисковых запросов с нулевым кликом. По мере того, как Google все больше переключается на бизнес ответов, доля поисковых запросов, которые заканчиваются без клика, растет и растет. Он считает, что обзоры искусственного интеллекта взорвут эту тенденцию.

«Если вы зависите от трафика Google и этот трафик был движущей силой вашего бизнеса, у вас долгосрочные и краткосрочные проблемы», — говорит он.

«Не паникуйте», — говорит Пичаи. Он утверждает, что даже в эпоху ИИ-обзоров люди по-прежнему будут переходить по ссылкам и углубляться в поиск по многим темам. «Основной принцип заключается в том, что люди ищут информацию. Они не ждут, что Google всегда будет давать им ответы, — говорит он. — Иногда да, но в подавляющем большинстве случаев вы смотрите на это как на отправную точку».

Тем временем Рид утверждает, что, поскольку AI-обзоры позволяют людям задавать более сложные вопросы и глубже погружаться в то, что они хотят, они могут быть полезны даже некоторым типам издателей и малым предприятиям, особенно тем, которые работают в узких нишах: «По сути, вы охватываете новую аудиторию, потому что теперь люди могут более конкретно выражать свои желания, и поэтому тем, кто специализируется в определённой области, не нужно ранжироваться по общим запросам».

«Я собираюсь начать с чего-то рискованного», — говорит мне Ник Тёрли из окна Zoom. Тёрли — руководитель продуктовой команды ChatGPT, и он демонстрирует новый инструмент веб-поиска от OpenAI за несколько недель до его запуска. «Обычно я должен попробовать его заранее, но я просто поищу вас, — говорит он. — Это всегда рискованная демонстрация, потому что люди, как правило, внимательно следят за тем, что о них говорят в интернете».

Он вводит моё имя в поисковое поле, и поисковая система-прототип выдаёт несколько предложений, почти как биография оратора. Она правильно определяет меня и мою нынешнюю должность. Она даже выделяет конкретную историю, которую я написал много лет назад и которая, вероятно, была моей самой известной. Короче говоря, это правильный ответ. Фух?

Через несколько недель после нашего разговора OpenAI добавила в ChatGPT функцию поиска, дополнив ответы своей языковой модели информацией из интернета. Если модель считает, что ответ будет полезнее с актуальной информацией, она автоматически выполнит поиск в интернете (OpenAI не раскрывает, кто её партнёры по поиску) и включит эти ответы в свой ответ со ссылками, если вы захотите узнать больше. Вы также можете вручную заставить её выполнить поиск в интернете, если она не делает этого самостоятельно. OpenAI не раскрывает, сколько людей используют его веб-поиск, но сообщает, что около 250 миллионов человек еженедельно пользуются ChatGPT, и все они потенциально могут столкнуться с ним.

«В интернете невероятное количество контента. Многое происходит в реальном времени. Вы хотите, чтобы ChatGPT мог использовать это для улучшения своих ответов и стать для вас лучшим суперпомощником».

Кевин Вейл, директор по продуктам OpenAI

По словам Фишкина, эти новые формы поиска с помощью искусственного интеллекта пока не бросают вызов поисковому доминированию Google. “Похоже, что это не каннибализирует классические формы веб-поиска”, - говорит он.

OpenAI настаивает на том, что на самом деле не пытается конкурировать в сфере поиска, хотя, честно говоря, мне это кажется попыткой создать ложное впечатление. Скорее, по их словам, веб-поиск — это в основном способ получить более актуальную информацию, чем данные в их моделях обучения, которые, как правило, имеют конкретные даты окончания обучения, часто отстоящие на несколько месяцев или даже год назад. В результате, хотя ChatGPT может отлично объяснить, как работает нападение «Вест-Кост», он уже давно бесполезен в том, чтобы сообщить вам, какой счёт у «49-х». Больше не будет.

«Я смотрю на это с точки зрения: «Как мы можем сделать так, чтобы ChatGPT отвечал на любой ваш вопрос? Как мы можем сделать его более полезным для вас в повседневной жизни?» И именно здесь нам на помощь приходит поиск», — говорит мне Кевин Вейл, директор по продуктам в OpenAI. «В интернете невероятное количество контента. Многое происходит в реальном времени. Вы хотите, чтобы ChatGPT мог использовать это для улучшения своих ответов и стать для вас лучшим суперпомощником».

Сегодня ChatGPT может генерировать ответы на актуальные новости, а также информацию о ценах на акции практически в реальном времени. И хотя интерфейс ChatGPT уже давно стал, скажем так, скучным, результаты поиска содержат всевозможные мультимедийные материалы — изображения, графики и даже видео. Это совсем другой опыт.

Вейл также утверждает, что у ChatGPT больше свободы для внедрения инноваций и развития в своём направлении, чем у таких конкурентов, как Google, — даже больше, чем у его партнёра Microsoft с Bing. Оба этих сервиса зависят от рекламы. OpenAI — нет. (По крайней мере, пока.) Он получает доход от разработчиков, компаний и частных лиц, которые используют его напрямую. Сейчас он в основном сжигает большие суммы денег — по некоторым данным, в 2026 году он потеряет 14 миллиардов долларов. Но есть одна вещь, о которой ему не нужно беспокоиться, — размещение рекламы в результатах поиска, как это делает Google.

Как и Google, ChatGPT получает информацию от веб-издателей, обобщает её и включает в свои ответы. Но он также заключает финансовые сделки с издателями, выплачивая им за предоставление информации, которая используется в его результатах. (MIT Technology Review вёл переговоры с OpenAI, Google, Perplexity и другими компаниями о сделках с издателями, но не заключал никаких соглашений. Редакция не участвовала в этих переговорах и не была проинформирована об их содержании.)

Но дело в том, что для того, чтобы веб-поиск выполнял то, чего хочет OpenAI, — был более актуальным, чем языковая модель, — он также должен получать информацию от всевозможных издателей и источников, с которыми у него нет соглашений. Глава OpenAI по сотрудничеству со СМИ Варун Шетти рассказал MIT Technology Review, что компания не будет отдавать предпочтение своим партнёрам-издателям.

Вместо этого, как мне сказали в OpenAI, модель сама находит наиболее достоверный и полезный источник для любого заданного вопроса. И это тоже может быть странно. В том самом первом примере, который она мне показала, когда Терли ввёл это имя в поиск, она описала статью, которую я написал много лет назад для Wired о взломе. Эта статья остаётся одной из самых читаемых из всех, что я когда-либо писал. Но ChatGPT не дал на неё ссылку. Он дал ссылку на короткую перепечатку из The Verge. Следует признать, что это была экспериментальная версия поиска, которая, по словам Терли, была «рискованной».

Когда я спросил его об этом, он не смог толком объяснить, почему модель выбрала именно эти источники, потому что модель сама проводит оценку. Компания помогает ей, определяя — иногда с помощью пользователей, — какие ответы она считает лучшими, но на самом деле модель выбирает их сама.

«И во многих случаях он ошибается, поэтому нам есть над чем поработать, — сказал Тёрли. — Наличие модели в цикле — это совсем другой механизм, нежели тот, что использовался в поисковых системах в прошлом».

В самом деле!

Модель, будь то GPT-4o от OpenAI, Gemini от Google или Claude от Anthropic, может быть очень, очень хороша в объяснении вещей. Но обоснование его объяснений, причины выбора конкретного источника и даже язык, который он может использовать в ответе, - все это довольно загадочно. Конечно, модель может объяснить очень многие вещи, но не тогда, когда дело доходит до ее собственных ответов.

Почти десять лет назад, в 2016 году, Пичаи написал, что Google переходит от «мобильности во главе угла» к «искусственному интеллекту во главе угла»: «Но в ближайшие 10 лет мы перейдём в мир, в котором искусственный интеллект будет во главе угла, в мир, где вычисления станут общедоступными — дома, на работе, в машине или в пути — и взаимодействие со всеми этими устройствами станет гораздо более естественным и интуитивно понятным и, прежде всего, более интеллектуальным».

Мы уже там — в каком-то смысле. И это странное место. Оно будет становиться всё более странным. Это особенно актуально, поскольку то, что мы сейчас считаем отдельными действиями — запрос в поисковой системе, ввод данных в модель, поиск сделанной нами фотографии, выбор того, что мы хотим прочитать, посмотреть или услышать, запрос фотографии, которую мы хотели бы сделать, но не сделали, но всё равно хотели бы увидеть, — начинает объединяться.

Результаты поиска, которые мы видим в генеративном ИИ, лучше всего рассматривать как промежуточную цель, а не как конечный пункт назначения. Возможно, самое важное — это не сам поиск, а то, что поиск дал разработчикам моделей ИИ возможность включать информацию в реальном времени в свои входные и выходные данные. И это открывает множество возможностей.

«ChatGPT, который может понимать веб-страницы и получать к ним доступ, будет не просто подводить итоги. Он может выполнять задачи за вас. И я думаю, что у него довольно интересное будущее, — говорит Вейл из OpenAI. — Представьте, что модель бронирует для вас билет на самолёт, заказывает еду через DoorDash или просто выполняет за вас общие задачи в будущем. Как только модель научится пользоваться интернетом, её возможностям не будет предела».

Это то самое агентское будущее, о котором мы уже давно слышим, и чем больше моделей ИИ используют данные из интернета в реальном времени, тем ближе оно становится.

Допустим, через несколько недель вам предстоит поездка. Агент, который может получать данные из интернета в режиме реального времени, может забронировать для вас билеты на самолёт и номера в отеле, заказать столик в ресторане и многое другое, основываясь на том, что он знает о вас и вашей предстоящей поездке, — и всё это без вашего участия. Другой агент может, например, отслеживать наличие определённых заболеваний в сточных водах вашего дома и в ответ на это заказывать анализы и лечение. Вам не придётся искать причину странного шума, который издаёт ваша машина, потому что агент в вашем автомобиле уже сделал это и договорился о ремонте.

«Это не всегда будет просто поиск и выдача ответов, — говорит Пичаи. — Иногда это будут действия. Иногда вы будете взаимодействовать в реальном мире. Таким образом, во всём этом есть понятие универсальной помощи».

И способы, с помощью которых эти устройства смогут предоставлять ответы, тоже быстро развиваются. Например, сегодня Google может не только искать текст, изображения и даже видео, но и создавать их. Представьте, что эта функция сочетается с поиском в различных форматах и на разных устройствах. «Покажи мне, как выглядит певчая птица Таунсенда на дереве передо мной». Или «Используй мои существующие семейные фотографии и видео, чтобы создать трейлер к нашему предстоящему отпуску в Пуэрто-Рико в следующем году, чтобы мы посетили все лучшие рестораны и достопримечательности».

«В первую очередь мы сделали это на стороне ввода, — говорит он, имея в виду способы, с помощью которых Google теперь может искать изображения или видео. — Но вы можете представить это и на стороне вывода».

Это то будущее, которое, по словам Пичаи, он с нетерпением ждет в Сети. Google уже продемонстрировал, как это может выглядеть с помощью NotebookLM, инструмента, который позволяет загружать большие объемы текста и преобразовывать его в подкаст для общения. Он представляет себе этот тип функциональности — способность принимать один тип входных данных и преобразовывать его в различные выходные данные — преобразуя то, как мы взаимодействуем с информацией.

Этим летом на конференции разработчиков Google продемонстрировала одну из версий такого результата, когда камеры и микрофоны в телефонах и смарт-очках понимают контекст вокруг вас — онлайн и офлайн, звуковой и визуальный — и могут запоминать и реагировать различными способами. Например, Astra может посмотреть на грубый набросок гоночного автомобиля «Формулы-1» и не только идентифицировать его, но и объяснить назначение различных деталей.

Но вы можете представить, что всё зайдёт немного дальше (и так и будет). Допустим, я хочу посмотреть видео о том, как починить что-то на моём велосипеде. Такого видео не существует, но информация есть. Генеративный поиск с помощью ИИ теоретически мог бы найти эту информацию где-нибудь в интернете — например, в руководстве пользователя, спрятанном на сайте компании, — и создать видео, которое покажет мне, как именно сделать то, что я хочу, точно так же, как сегодня он мог бы объяснить мне это словами.

Вот что начинает происходить, когда вы объединяете все накопленные человечеством знания — знания, которые раньше хранились в разрозненных языковых и форматных хранилищах; карты, бизнес-реестры и артикулы товаров; аудио- и видеофайлы, базы данных с числами, старые книги, изображения и вообще всё, что когда-либо было опубликовано, отслежено, записано; всё, что происходит прямо сейчас, повсюду, — и внедряете во всё это модель. Модель, которая, возможно, не может понять всё в точности, но способна собрать эту информацию воедино, перегруппировать её и выдать обратно множеством различных, возможно, полезных способов. Способов, которые не может обеспечить простой индекс.

Это то, к чему мы приближаемся и что начинаем видеть. И когда Google представит это миллиарду людей, многие из которых впервые будут взаимодействовать с диалоговым ИИ, что это будет означать? Что мы будем делать по-другому? Всё меняется так быстро. Подождите, просто подождите.