Книга: Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google @bookiniero
Назад: Прошлое без глубокого обучения
Дальше: Искусственный интеллект – судьба Baidu

Поисковая система продолжает развиваться

С развитием и распространением мобильного интернета и искусственного интеллекта форма поиска сильно изменилась. Например, на основе различных платформ появилась возможность искать необходимую веб-страницу не только путем ввода текстового запроса, но и посредством голосового ввода или ввода изображения. Кроме того, теперь не только люди ищут информацию, но и информация рекомендуется людям, которые предположительно в ней нуждаются. Некоторые полагают, что это является проблемой поисковиков. Но Ван Хайфэн считает, что поисковые системы всегда воспринимали эти два процесса как единое целое.

Создание Feed (информационного потока) является консенсусом многих интернет-компаний. «Люди, ищущие информацию» и «информация, ищущая людей», или поисковая система и система Feed, не являются противоположными, а дополняют друг друга. Они играют разные роли в разных сценариях в разное время. Это называется сотрудничеством. Например, иногда нужно взять на себя инициативу, чтобы найти что-то. Иногда нужен друг, чтобы он дал рекомендацию. Иногда вам нужна система, чтобы угадать ваши предпочтения. Предположим, кто-то рекомендует вам статью. Когда в процессе чтения вы наткнетесь на слово, которое не очень хорошо понимаете, вам нужно будет воспользоваться системой поиска, чтобы найти его значение. Конечно, Feed может угадать, какие слова могут заинтересовать пользователей. Каналы не могут прокручивать один и тот же контент каждый день. Поэтому лучше всего ищется наиболее актуальная и горячая часть контента. В разных сценариях потребности пользователя в поисковой системе и в Feed преобразуются друг в друга и взаимодополняются. По тому, насколько эффективно это происходит, можно судить об уровне развития искусственного интеллекта. Чем больше будет использовано данных и технологий, тем больше вероятность, что результат будет хорошим.

С аппаратным обеспечением и данными, которые необходимы для поисковой системы, обеспечить функционирование Feed несложно. А вот компенсировать проблемы результатов поисковика и отсутствия данных сложнее. Поисковая система Baidu собирает и анализирует сотни миллиардов веб-страниц. Поэтому масштаб данных Baidu продолжает повышать эффективность продуктов Feed и обеспечивает необходимую защиту.

Поисковые системы продолжают развиваться в потоке данных. Feed – это только следующий шаг, который ведет к созданию вездесущей поисковой системы. Толковальная машина все приближается к тому, чтобы понимать суть запроса пользователя по минимуму слов. Она может анализировать местоположение пользователя, его характеристики и особенности, привычки и т. д., а потом использовать полученные сведения, чтобы предоставить пользователю наиболее подходящую информацию. В будущем нам не нужно будет активно «искать» информацию. Поисковые системы на основе наших данных смогут взять на себя инициативу – угадывать и предоставлять нам информацию, которая нужна. Представьте, например, что вы находитесь в ресторане, а система уже определила ваше местоположение на основе предыдущего поискового запроса. Даже если пользователь ничего не «спрашивал», поисковики будут активно собирать информацию на основе запрашиваемой ранее. Например, предлагать фильмы-новинки или показывать ближайший кинотеатр. Эта идея была опробована на продуктах Baidu. Даже если пользователь временно не обращает внимание на какую-либо информацию, которая появляется в Feed, она будет храниться разумно, как невидимая библиотека, чтобы пользователь мог исследовать ее позже. Интеллектуальные поисковые системы растут вместе с нами.

Поисковая система – самый большой проект искусственного интеллекта

Поисковые системы работают постоянно. Они – зеркальное отражение стремления человечества к обучению. Поисковые системы получают доступ к каждому моменту сбора и обработки массивов данных, к каждой открытой странице в интернете, будь то сайты поставщиков электроэнергии, социальные сети или новостные порталы.

Поисковая система является просеивателем, экспериментальным полем и цифровым коллайдером. Она в сочетании с распознаванием речи, изображений и машинным переводом получает ценные данные от каждого пользователя, что помогает нейронной сети оптимизировать результаты обучения и обеспечить качественное развитие цикла.

Развитие технологии обработки естественного языка принесет много сюрпризов. Помимо всего прочего, машина сможет писать обзоры финансового рынка, спортивные новости, даже литературу. Уже теперь машина пишет «поэзию» так, что трудно отличить от произведения, написанного человеком. Робот-комментатор, наблюдающий за баскетболом или футболом, сможет не только быстро сообщить о ситуации на поле, но и ответить на вопросы. Это немного напоминает умную программу «Саманту» в научно-фантастическом фильме «Her» (ОНА). Она влюблялась во множество людей одновременно. Любовь – это, вероятно, самый глубокий язык, это мысли и эмоции. «Саманта» – высшая ступень технологии обработки естественного языка. Она демонстрирует возможность глубоких отношений между человеком и машиной. Может быть, в будущем поисковые системы действительно смогут, как Саманта, воспринимать символы, которые находятся где-то между языком и смыслом. Пока это находится за пределами человеческого воображения.

Искусственный интеллект – это своего рода «физическая активность», достаточная физическая сила, чтобы справляться с огромными данными и вычислениями. У университетов или небольших интернет-компаний существенно ограничены средства на обеспечение массивами данными и качественной техникой для развития ИИ. Даже без учета затрат на приобретение CPU, GPU и других технологий эксплуатация и их техническое обслуживание обходятся очень дорого. Только затраты на электроэнергию для обеспечения работы AlphaGo составляют около 3000 долларов. Помимо традиционных серверов, пропускной способности и другой инфраструктуры, Baidu имеет сотни серверов GPU, которые поддерживают операции искусственного интеллекта. 16 карт GPU установлены на самом высоком сервере в конфигурации. Резервы данных, аппаратная база, размер рынка и команда талантов объединены, чтобы увеличить преимущество. Это не одномоментная, но самая большая базовая платформа искусственного интеллекта, созданная, чтобы человек мог «знать больше, делать больше, испытывать больше».

Назад: Прошлое без глубокого обучения
Дальше: Искусственный интеллект – судьба Baidu