Книга: Про GOOGLE
Назад: Глава 2. Домашнее задание
Дальше: Глава 4. #Правописание

Глава 3. Давно забытый кошмар: поиск до изобретения Google

Сегодня, если ты наберешь «В чем значимость Уильяма Шекспира?» В Google, ты получишь около 16 700 000 результатов всего за 0,63 секунды. И все эти результаты упорядочены по значимости. Не так уж и сложно, не правда ли?
Не правда!
Приготовься. В этой поездке на машине времени будет трясти.
До Google люди жили в мире, где результаты поиска были бессмысленными. Вот ты входишь в поисковую систему. Вводишь какое-нибудь простое ключевое слово, например, «Шекспир», так как поисковая система не может обработать разговорный текст.
Возможно, ты хотел узнать, «где родился Шекспир?». Но все, что ты смог напечатать, – фамилию Уильяма.
Разговорный текст – это фраза или предложение, которое звучит так же, как бы ты его произнес. Это неформальное и естественное выражение твоих мыслей или вопросов.
Ты нажимаешь «ввод» и ждешь, пока страницы за страницами результатов загружаются без какого-либо порядка. Фактически то, что ты ищешь, может находится в самом последнем результате поиска – или где-то в середине. Мало того, спустя целый час поиска ты скорее всего с гневом осознаешь, что нужно было ввести другое ключевое слово (и повторить все заново). Ты пытаешься закричать, но сил нет даже на шепот.
В чем проблема? Поиск в Интернете основывался на ключевых словах. Поэтому, если ты искал информацию о лошадях, поиск выдавал тебе каждый сайт, на котором упоминалось слово «лошадь». И тебе приходилось сидеть и загружать каждый результат в надежде наткнуться на нужную информацию.
Это было похоже на поход в библиотеку с просьбой рассказать о лошадях. Библиотекарь берет каждую книгу, журнал и брошюру, в которых есть по крайней мере одно слово «лошадь». Затем он сбрасывает их в беспорядочно перемешанные кучи, в которых тебе предстоит рыться, пока ты наконец не найдешь то, что искал. Таким был поиск до изобретения Google. Не многим хватает мужества вспоминать о тех временах. Нам был необходим способ как-то организовывать эту информацию.

PageRank

Математический мозг Сергея Брина был идеальным котелком для варки идей алгоритма, который бы анализировал ссылки и ранжировал веб-страницы. Это было похоже на фирменный рецепт блюда. Ларри и Сергей назвали этот особый соус PageRank.
Слово PageRank звучит знакомо? Ты угадал! Ларри и Сергей назвали его в честь Ларри, используя его фамилию, Пейдж.
Представь, что ты опубликовал веб-страницу, на которой ты восторгаешься фильмом «Звездные войны: Пробуждение силы» (что, кстати говоря, по праву). Как алгоритм сможет отличить твой сайт от, например, StarWars.com? Какой сайт уместнее? Какой авторитетнее? Какой лучше освещает тему? Ответ кроется в обратных ссылках. Со столь же огромной, как твоя любовь к кинокартине, вероятностью на твой фан-сайт все-таки ссылается не так много людей, как на StarWars.com. В конце концов, StarWars.com может похвастаться сенсациями, играми, видео, закулисными кадрами, анонсами и т. д. Между тем на твоем фан-сайте может быть размещен лишь один пост о том, какое впечатление на тебя произвел этот фильм. PageRank может определить, какой сайт важнее, исходя из количества входящих ссылок. А теперь настоящий вынос мозга. Важно не то, сколько ссылок ведут на твой сайт, а то, насколько важны сайты со ссылками на твой… что определяется количеством входящих ссылок на эти сайты. Затем, когда определенной странице присвоен рейтинг PageRank, Сергей также нашел способ проанализировать такие факторы, как ключевые слова, капитализация, размер шрифта, расстояние между словами на странице и многое другое. Эти ориентиры называются «сигналами». Анализ всех этих сигналов помог Сергею разработать алгоритм, который вырисовал довольно четкую картину релевантности веб-страницы.
Как сказал Ларри интервьюеру: «Мы преобразуем всю сеть в большое уравнение с несколькими сотнями миллионов переменных, которыми выступает PageRank всех веб-страниц; и миллиардами свободных членов, в качестве которых выступают ссылки». Другими словами, сеть была просто гигантской, сложной математической задачей. Той, которую решили Ларри и Сергей.
Когда изобретатели создают что-то новое, они подают патент на свое изобретение. Эта документация защищает изобретение, чтобы другие не могли его скопировать. Поскольку PageRank был создан студентами Стэнфорда на кампусе, патентом на PageRank владеет Стэнфордский университет. Стэнфорд лицензировал этот патент исключительно для Google в обмен на акции в компании. Когда университет продал эти 1,8 миллиона акций Google в 2005 году, они заработали 336 миллионов долларов. Неплохо! (Думаю, это компенсирует недостающие компьютеры.) С патентом можно ознакомиться здесь: https://www.google.com/patents/US6285999.
В 1996 году, когда Ларри и Сергей запустили BackRub для сканирования в Интернете и создания индекса ссылок, они затем использовали PageRank для организации и ранжирования всех этих веб-данных. Анализируя результаты, они поняли, что их проект был очень похож – ну очень похож – на поисковик, только с точными результатами. Эврика! Они сравнили результаты запроса с результатами самых популярных поисковых систем тех лет. Бесспорно, результаты PageRank оставляли всех остальных далеко позади.
Как и у любого пользователя сети, первый поиск Ларри на BackRub был… его собственное имя.
Ларри и Сергей поняли, что они только что случайно произвели революцию в веб-поиске.

 

Скриншот первоначальной страницы BackRub из Internet Archive WayBack Machine

 

Взлет

Шумиха вокруг BackRub разлетелась по кампусу как пожар. Студенты, в частности, были очень взволнованы: не каждый день возвращаешь назад часы своей жизни. Дни просеивания бессмысленных результатов поиска закончились. Это поражало воображение. Челюсти отваливались.
Впервые ты мог искать и быстро находить в Интернете нужную информацию – даже ту самую, что ты искал!
Уже вскоре BackRub ежедневно использовали десять тысяч человек.
Спрос на BackRub резко подскочил. Однако не только он один бурно развивался.
Сама сеть росла с безумной скоростью, втрое увеличившись в размере с 1996 по 1997 год.
Это означало, что Ларри и Сергею было нужно еще больше компьютеров и дискового хранилища для сканирования постоянно расширяющейся сети и хранения постоянно растущего количества ссылок.
Чтобы поспевать за спросом, они добавляли компьютеры, различные части и стойки – их раздутый самодельный сервер быстро заполонил весь их угол кабинета. На очереди была комната Ларри. Они и ее заполнили серверами. Сергей также пожертвовал своей комнатой. Теперь это был бизнес-офис BackRub.
Но по мере роста сети серверов Ларри и Сергея их электроснабжение не возрастало. Им нужен доступ к рубильнику, который находился в запертом подвале. Но отсутствие ключа (или разрешения) ставило их в безвыходное положение. Тогда Сергей обратился за помощью к одной из своих любимых книг: «Руководство Массачусетского технологического института по отпиранию замков». Несложно угадать, что произошло потом. Они проникли в подвал и поддали мощности своей компьютерной системе.
Проникновение в подвал также решило еще одну проблему. Вопрос с пропускной способностью. Одним лишь щелчком тумблера BackRub мог получить доступ к полной пропускной способности Стэнфорда в 45 Мбит/с вместо простых 10 Мбит/с, выделенных их зданию. Переключившись, они увеличили свою пропускную способность более чем в четыре раза.
Но сколько бы сил они ни вкладывали в проект, им всегда требовалось больше. Их инновационное домашнее задание регулярно оставляло Стэнфорд без подключения к Интернету. Они использовали более половины пропускной способности института. И BackRub не просто потреблял тонны электричества, серверного пространства и интернет-соединения, он также занимал каждый свободный ото сна час Ларри и Сергея.

Позвольте дать небольшой совет…

Когда Ларри и Сергей поступили в Стэнфорд, каждому из них был назначен научный руководитель, или профессор, который должен был помогать им на пути к докторской степени. Эти взаимоотношения очень важны: он отсеивает твои идеи, помогает решать проблемы и определиться с направлениями исследования, утверждает твою тему диссертации и любые другие вещи (не важно, хорошие, плохие или трудные), которые ты предлагаешь.
Руководителем Ларри назначили Терри Винограда, пионера человеко-машинного взаимодействия. Для Ларри Виноград не был незнакомцем. Наоборот, несколько лет назад, когда Ларри еще был маленьким мальчиком, его отец провел годичный творческий отпуск в Стэнфорде – с Ларри в прицепе. Некоторые сотрудники до сих пор помнят того любопытного семилетку. А Ларри с тех пор запомнил Терри Винограда.
Винограду нравилось, что у Ларри были большие мечты и вера в то, что он сможет воплотить их в реальность. Когда Ларри высказал свой интерес к развивающейся Всемирной сети, Виноград призвал его посвятить свою диссертацию именно этой теме.
В электронном письме 1996 года, которое Ларри отправил своему руководителю, он просил помочь ему получить еще больше дискового пространства. Скачивание сети было дорогим занятием, потому что требовало уйму места на диске. Ларри написал Винограду, что розничная цена на диск составляла тысячу долларов за 4 Гб. Он думал, что ему понадобится 8 Гб. На самом деле нужно было гораздо больше – первый сервер Google занимал 40 Гб!
Виноград также разруливал жалобы на ранних этапах. Владельцы сайтов могли заявить, что BackRub запрашивал их веб-страницы, и многие из них не понимали зачем, так что это им не нравилось.
Научного руководителя Сергея, Гектора Гарсия-Молина, возглавлявшего кафедру информатики, сразу поразил его талант.
Сергей также посвятил много времени, советуясь со стэнфордским профессором Радживом Мотвани. Хотя Мотвани не был его официальным научным руководителем, Сергей регулярно приходил к нему с техническими вопросами.
«Когда я заинтересовался сбором данных, Раджив помог скоординировать регулярные встречи для обсуждения этой темы, – писал Сергей спустя годы в своем блоге. – Хотя я был всего лишь одним из сотен аспирантов на кафедре, он всегда находил время и силы, чтобы мне помочь. Позже, когда мы с Ларри начали работать вместе над исследованиями, которые привели нас к созданию Google, Раджив поддерживал нас и направлял на пути, полном технических и организационных испытаний».
После того как Сергей выпустился из Стэнфорда, он и Мотвани поддерживали связь друг с другом. И когда Мотвани неожиданно скончался в 2009 году, в память о нем Google выделил 2,5 миллиона долларов профессуре Стэнфорда.
Научные руководители сыграли ключевую роль в придании формы образованию, исследованиям и инновациям Ларри и Сергея. Теперь им понадобится их помощь в принятии очень сложных решений.
Назад: Глава 2. Домашнее задание
Дальше: Глава 4. #Правописание