Глава 2. Домашнее задание
Есть домашнее задание, а есть ДОМАШНЕЕ ЗАДАНИЕ. Есть то, с которым ты управишься за пять минут, а есть то, что определяет всю твою последующую жизнь. Будучи студентами в Стэнфорде, Ларри Пейдж и Сергей Брин столкнулись с самым эпичным домашним заданием – докторской диссертацией. Это как жениться – на своей домашке. Сначала ты предлагаешь свою тщательно обдуманную тему своим профессорам. С их утверждения ты ныряешь в самые глубины исследования и тратишь часы, дни, недели, месяцы – сколько бы ни потребовалось для совершения прорыва, обнаружения чего-то или расширения представления человечества о твоей теме. И если этого напряжения недостаточно, то последний шаг – представить свое исследование комиссии из профессоров. Профессоров, которые могут задать вопросы по содержанию твоей работы – даже бросить тебе вызов, – и тебе необходимо защитить свой труд!
Ларри знал, что ему крайне важно найти подходящую тему для своей диссертации. И он быстро обратил свое внимание на Всемирную сеть. В 1995 всемирной паутине было всего 6 лет – совсем еще ребенок. Тогда, в древние времена Интернета, насчитывалось всего около 10 миллионов веб-страниц. И каждая из них загружалась по 30 секунд – целую вечность.
Сегодня Всемирная сеть состоит из 4,73 миллиарда веб-страниц (и это число постоянно растет).
Внимание, термины! «Веб» и «Интернет» это не одно и то же. Интернет – это гигантская сеть компьютеров, соединенная по проводам и беспроводным сигналам. Эта сеть всех сетей позволяет компьютерам обмениваться информацией. Веб – это весь контент – документы, файлы, папки, веб-страницы и другие ресурсы, доступные в Интернете, соединенные при помощи ссылок.
И все же, когда Ларри смотрел на Интернет, он видел не просто кучу корявых примитивных веб-страниц. Он видел математический график.
Каждая страница была точкой на графике. И прямо как точки на графике, соединенные линией, сайты были соединены ссылками.
Так у него возникли вопросы. Были ли важны эти ссылки? Что они могли рассказать о конкретной странице в Интернете? Ларри хотел знать больше.
И тогда он заметил кое-что интересное: взглянув на веб-страницу, было легко определить, сколько у нее было исходящих ссылок на другие сайты. Они были на виду, прямо на странице в гипертексте, готовые к тому, чтобы по ним кликнули. Ларри же было интересно, сколько других сайтов ссылались на эту конкретную страницу? Сколько у нее было входящих ссылок? В 1995 году никто это не знал.
Гипертекст – это текст, который направляет тебя на другой документ или веб-страницу. Зачастую он выделен другим цветом. Ты можешь навести курсор на гипертекст и кликнуть по нему, чтобы отправиться по ссылке к какому-либо документу, веб-странице или информации.
Ларри объяснил это репортеру таким образом: «У ранних версий гипертекста был серьезный недостаток: ты не мог пройти по ссылке обратно». Ларри хотел это исправить.
Обратные ссылки
Чтобы стать президентом класса, тебе нужно не перечислить наибольшее число лидеров, которых ты считаешь прекрасными, а набрать наибольшее число людей, отдавших за тебя свой голос. Другими словами, популярность определяется не тем, сколько людей тебе нравятся, а тем, скольким людям нравишься ты.
Изучая структуру Интернета, Ларри обнаружил схожую истину. Не имеет значения, на сколько сайтов ты ссылаешься. Что действительно важно, так это то, сколько сайтов ссылается на твою страницу. Чем больше сайтов со ссылками к тебе, тем релевантнее, значимее и авторитетнее твой сайт. Каждый ссылка с веб-страницы на твой сайт равна отданному голосу. Чем больше у страницы голосов, тем она важнее и тем, думается, информация в ней достовернее.
Эта мысль напомнила Ларри о том, о чем часто говорили в доме, где он рос: цитировании.
Представь, что ты ученый, который без устали трудится над исследованием в области изменения климата. Ты обнаруживаешь новые доказательства и подтверждаешь новые теории о том, как люди воздействуют на климат. Ты публикуешь эти теории в научном журнале. Дальше могут произойти две вещи. Твою работу попросту проигнорируют. Или же она может оказаться настолько значима, что ученые со всего света начнут ее обсуждать. Основываясь на твоем исследовании, другие ученые выведут его на новый уровень, проводя все новые разработки, эксперименты и приводя новые доказательства. И когда они опубликуют свои выводы, они упомянут в них тебя. Они процитируют твою работу, твое исследование, твой вклад в науку. Каждое такое упоминание называется цитированием. А что, если сотни и даже тысячи ученых цитируют твою работу? Это говорит о качестве и авторитетности исследования. С большим цитированием повышается важность работы.
Ларри интересовало, можно ли проанализировать обратные ссылки, чтобы определить авторитетность веб-страницы подобно тому, как цитирование придает силу исследованию. Это была его большая идея. Претворить ее в жизнь казалось непростым делом.
Чтобы достичь своей цели, Ларри было необходимо проводить поиски во Всемирной сети, исследовать веб-страницы, считать их обратные ссылки и упорядочивать результаты. Этому требовался продуманный математический алгоритм.
Математический алгоритм – это специальный набор шагов, которым необходимо следовать для решения какой-либо математической задачи или выполнения и завершения компьютерного процесса. Еще один способ представить алгоритм – посмотреть на него как на кулинарный рецепт. Пошаговое выполнение инструкций необходимо для достижения конкретного результата.
И у него на примете был как раз подходящий математический ум для этой работы: Сергей Брин. Оказалось, что Сергей тоже все еще был в поиске своей темы диссертации. Идея Ларри показалась ему захватывающей. Сергей объяснил: «Потому что она касалась сети, которая является отражением людских знаний, и потому что Ларри мне понравился».
Но это не было простой задачей. В конце концов, они собирались сосчитать и проанализировать все ссылки со всей всемирной паутины, все 10 миллионов страниц. Им бы понадобилось запустить поискового бота, собирать ссылки, хранить их, а затем еще и анализировать их ценность. Это значит, что нужно было скачать Всемирную сеть – всю целиком.
У поисковых ботов есть пара других крутых имен: сборщики и пауки! Боты это ничто иное, как программы, которые посещают веб-страницы и считывают их содержимое. Каждый сборщик (или бот) охотится на конкретную информацию. Как только он ее находит, паук создает базу данных или индекс того, что найдено, облегчая доступ к информации.
Пропускная способность, необходимая для такой задачи, должна была быть внушительной, намного шире, чем для обычного проекта студента Стэнфорда. Это было куда более крупное дело. Не говоря уже о том, что они собирались работать с кучей данных и им бы понадобился сервер, который бы смог вместить и хранить в себе столько информации.
Сервер – это компьютер со специальной задачей или набором задач. Есть много различных видов серверов. Некоторые, например, хранят файлы или управляют трафиком сети или обеспечивают загрузку веб-страниц. Предназначение сервера определяется его программным обеспечением.
Пропускная способность (ширина полосы) – это частота передачи данных, обычно измеряемая в битах в секунду для данного канала. Наименьшая единица информации в компьютере известна как двоичный символ или бит. Бит – это всегда 1 или 0. Если речь идет о битах в секунду, имеется в виду то, как быстро эти мельчайшие частицы информации передаются или принимаются за одну секунду.
В далеком 1995 году у людей были модемы, которые подключались к Интернету по телефонным линиям. Максимальная скорость была 0,056 мегабита в секунду (Мбит/с). Сегодня большинство людей в Америке подключаются к Интернету со скоростью как минимум в 20 Мбит/с. Это значит, что сегодня мы можем скачивать фотографии мгновенно. Но тогда даже загрузка одного изображения низкого качества могла занять несколько минут.
Попрошайничество, Заимствование, Шпионаж
Что делать, если тебе нужна тонна компьютерного оборудования, но у тебя нет тонны денег? Именно с такой проблемой столкнулись Ларри и Сергей. Сидя в своем кабинете, также известном как Гейтс 360 (да, он назван в честь того самого Гейтса, Билла Гейтса из Microsoft), Ларри и Сергей быстро продумали хитрый план.
Рыская у погрузочной платформы здания информатики Стэнфордского университета, Ларри и Сергей шпионили, наблюдая за компьютерными поставками. Они точно выяснили, сколько компьютеров поставлялось и кому они предназначались.
Затем следовал их выход!
– Добрый день!
– Мы тут заметили, что этим утром вам доставили двадцать компьютеров.
– Наверняка вы бы смогли обойтись и девятнадцатью?
И так они ходили от одной двери к другой, отслеживая поставки, попрошайничая, выпрашивая детали и заимствуя компьютеры. Пуская в ход те небольшие деньги, что у них были, и присваивая любые «невостребованные» поставки (кто-то назовет это воровством, другие назовут заимствованием – разница не большая), Ларри и Сергею удалось собрать все необходимое «барахло» для их проекта.
В то время компьютеры удивляли не только своей ценой, но и своим весом. Эта их особенность осложняла переноску. Поэтому Ларри и Сергей купили большую тележку, с помощью которой они тягали ящики «найденных» и «заимствованных» компьютеров в свой кабинет.
К счастью, это пространство они делили с компанией столь же причудливых персонажей.
Теперь, когда они собрали кучу компьютерных компонентов, электроники и дисков, пришло время соединить их.
А что может быть лучшим инструментом для этой задачи, как не… ЛЕГО! Или, вернее, самая дешевая его альтернатива, которую они только смогли найти. Ларри и Сергей решили, что, раз уж они бедные студенты, они не могут позволить себе настоящее Лего.
Во времена учебы в Мичиганском университете Ларри сумел выполнить задание, построив струйный принтер из Лего! Тогда он еще не знал, что эти навыки строительства из кирпичиков сыграют большую роль в достижении его цели по преображению мира.
Перебирая блоки, разбросанные по столу Ларри, парочка стала сцеплять пластиковые кирпичики друг с другом. Вскоре из беспорядка выросли разноцветные башенки. Поместив жесткие диски в такую башенку, они закончили сборку своего домашнего сервера. Некоторые углы даже скрепили клейкой лентой.
Первоначальный сервер Google состоял из десяти дисков объемом 4 ГБ (гигабайт), в общей сложности 40 ГБ или гигабайт. В 1996 году диски на 4 ГБ были самыми большими по объему. Сегодня можно купить жесткий диск, который поместится в ладони и будет вмещать 16 терабайт данных (это 16 000 гигабайт).
На этот сервер можно взглянуть своими глазами. Он выставлен в Инженерном центре Стэнфордского университета.
На сегодняшний день подсчитано, что Google использует около одного миллиона серверов!
Первая стойка для хранения серверов Google (сделанная из блоков Duplo после того, как оригинальный бренд не выдержал и развалился). Фото: Стив Юрветсон
Теперь настал момент истины. Сергей и Ларри подключили свое создание в компьютерную сеть Стэнфорда и начали скачивать Всемирную сеть.
Сработало. Их эксперимент сканировал веб и скачивал его.
Так родился «Google».
На самом деле, эм… он назывался BackRub. Именно так, когда Ларри и Сергей придумывали имя для своей идеи, что вскоре должна была изменить мир, они сошлись на BackRub.
И технически они как раз сделали первый шаг на своем пути: сканирование и загрузка всемирной паутины. Но BackRub был просто веб-искателем, удивительным, но все же… Теперь перед Ларри и Сергеем стояла поистине Геркулесова задача математически осмыслить все эти данные.
ЗНАКОМЬТЕСЬ С КОЛЛЕГАМИ ПО ОФИСУ: Шон Андерсон, студент, настолько погруженный в свои исследования, что не мог позволить себе терять время в своей квартире. Он стал и работать, и спать в офисе. Он также заставил весь офис растениями, а затем запрограммировал свой компьютер поливать их.
Тамара Мунзнер была единственной женщиной в группе. Чтобы иметь возможность работать, ей приходилось носить наушники, заглушающие печально известные «дебаты» Ларри и Сергея. На энергичном Лукасе Перейра и тихом студенте Бене Чжу заканчивался список соседей по офису.
У Ларри и Сергея также были два оплачиваемых ассистента: Скотт Хассан и Алан Стеремберг. И Скотт, и Алан учились в Стэнфорде и искали возможность заработать немного денег и поработать на крутом проекте. Когда Алан не был занят помощью Ларри и Сергею, он занимался своим собственным проектом, Weather Underground. Впоследствии он станет одним из самых популярных сайтов с прогнозами погоды благодаря его точности и детализации. А Алан станет президентом Weather Underground.
Скотт Хассан получил работу ассистента после встречи с Сергеем на игре по алтимат фрисби в Стэнфорде. Он был талантливым программистом и столь же одаренным по части пранков. Хассан в дальнейшем стал пионером робототехники и сегодня разрабатывает робота, в котором на катящемся теле располагается голова в виде телевизора с плоским экраном. Вместо того чтобы разговаривать с роботом, ты можешь общаться по видеочату с его владельцем в режиме реального времени, прямо как по FaceTime. Возможно, в будущем вместо того, чтобы идти в школу, можно будет просто отправить своего робота! Инновация Хассана зовется The Beam.