Книга: Алгоритмы для жизни: Простые способы принимать верные решения
Назад: Вывернуть библиотеку наизнанку
Дальше: Кеширование в тылу

Облако в конце улицы

Мы создали такую карту нашей страны, масштаб которой равняется миле на милю!
– И часто вы ею пользуетесь? – спросил я.
– Ее еще ни разу не расстилали, – сказал Майн Герр. – Крестьяне были недовольны. Они сказали, что если такую карту расстелить на всю страну, она скроет солнечный свет! Так что пока мы используем саму страну как ее карту, и смело могу вас заверить, действует она преотлично.
Льюис Кэрролл
Мы часто рассматриваем интернет как плоскую обособленную сеть, элементы которой слабо связаны между собой. По факту это представление в корне неверно. Четвертью всего интернет-трафика сегодня управляет одна корпорация, которой удается практически полностью избегать известности. Компания Akamai располагается в Массачусетсе и занимается кешированием контента.
Мы также считаем интернет абстрактным, нематериальным, постгеографическим. Нам говорят, что наши данные хранятся в «облаке», под которым подразумевается удаленное рассеянное пространство. И вновь все эти утверждения неверны. В действительности интернет построен с помощью бесчисленных кабельных соединений и металлических блоков. И он гораздо теснее связан с географией, чем вы могли бы себе представить.
Инженеры думают о географии в скромных масштабах, когда занимаются разработкой технического обеспечения компьютера: в частности, более быстрая память обычно устанавливается ближе к процессору, чтобы сократить время путешествия информации по проводам. Цикл современного процессора измеряется в гигагерцах, что означает, что процессоры осуществляют операции за доли наносекунд. Для сравнения, за такое время свет преодолевает расстояние всего в несколько дюймов. Таким образом, подготовка карты внутренней организации компьютера – вопрос затруднительный. Если применить тот же принцип, но в гораздо большем масштабе, мы увидим, что для функционирования сети, в которой протяженность проводов измеряется не дюймами, а тысячами миль, реальная география становится крайне важна.
Если вы можете создать кеш для контента интернет-страницы, которая располагается географически ближе к людям, которые ее посещают, то открываться такая страница будет гораздо быстрее. Бóльшая часть интернет-трафика сейчас регулируется с помощью сетей доставки контента (CDN), которые хранят копии популярных веб-сайтов на компьютерах по всему миру. Это позволяет пользователям, запрашивающим определенные страницы, получить необходимые данные от ближайшего компьютера без необходимости тянуться через континенты к основному серверу. Компания Akamai управляет крупнейшей сетью CDN. Провайдеры контента платят за то, чтобы их веб-сайты были «акамаизированы» и работали максимально быстро. Например, житель Австралии, который просматривает видео с сайта BBC, наверняка получает информацию с местного сервера Akamai в Сиднее; в любом случае запрос никогда не доходит до Лондона. «Ему и не надо, – комментирует главный разработчик архитектуры Akamai Стефан Лудин. – Мы считаем, что расстояние имеет значение, и наша компания создана на базе этого принципа».
Ранее мы отметили, что определенные типы компьютерной памяти работают быстрее, но при этом стоимость каждого такого элемента хранения информации выше, что и приводит к иерархии памяти, цель которой – добиться максимальной эффективности при использовании разных типов памяти.
Но для работы кеша на самом деле необязательно, чтобы память была сделана из разных материалов. Для кеширования более важна доступность и близость, нежели быстродействие. А это дефицитный ресурс.
Это фундаментальное наблюдение – что востребованные файлы должны храниться в непосредственной близости от того места, где они используются, – также можно перенести в чисто физическую реальность. Например, в огромных центрах обработки и исполнения заказов интернет-магазина Amazon обычно избегают применения понятных человеку способов организации работы вроде тех, которые вы можете наблюдать в библиотеке или магазине. Здесь, напротив, сотрудники должны размещать поступающую продукцию в любом свободном месте на складе: батарейки соседствуют с точилками для карандашей, памперсы с переносным грилем и обучающими игре на гитаре DVD-дисками. Для того чтобы отметить и сохранить месторасположение того или иного товара в центральной базе данных, используются штрихкоды. Однако эта на первый взгляд намеренно дезорганизованная система хранения все же имеет одно заметное исключение: все наиболее востребованные товары располагаются в отдельной зоне – более доступной, чем остальные. Эта зона и есть кеш Amazon.
Недавно Amazon получил патент на инновацию, которая развивает этот принцип. В патенте говорится об «опережающей отправке посылок». В прессе это нововведение объяснили так: Amazon сможет отправить вам то, что вы еще не купили. В Amazon, как в технологической компании, конечно, были бы рады иметь дар ясновидения, как у Белади, но в целом все снова сводится к кешированию. Действие их патента распространяется на отправку тех товаров, которые в последнее время приобрели большую популярность у жителей определенного региона. Товары заранее отправляются на склад в этом регионе, который становится своего рода аналогом сети CDN для материальных благ. Затем кто-нибудь делает заказ, и – вуаля – товар уже почти доставлен! Предугадать покупки нескольких клиентов трудно, но, если пытаешься предугадать покупки нескольких сотен человек, начинает работать закон больших чисел. Предположим, что кто-нибудь в Беркли собирается в определенный день заказать, скажем, туалетную бумагу. В тот момент, когда заказ сделан, товар уже находится на полпути к Беркли.
Когда вещи, ставшие популярными в определенном регионе, производятся в этом же регионе, возникает еще более интересная география облака. В 2011 году кинокритик Мика Мертес создал карту Соединенных Штатов на основе «любимых» фильмов по данным компании Netflix. На карте были показаны киноленты, необыкновенно популярные в каждом из штатов. В подавляющем большинстве случаев оказалось, что людям нравятся фильмы, снятые в их родных местах. Жителям штата Вашингтон нравится фильм «Одиночки», снятый в Сиэтле; в Луизиане смотрят «Большой кайф», снятый в Новом Орлеане; жители Лос-Анджелеса, что неудивительно, предпочитают «Лос-Анджелесскую историю»; на Аляске – «Бесстрашную Аляску», а в штате Монтана – «Небо Монтаны». И поскольку, пожалуй, локальное кеширование не может принести большей пользы, чем в случае с хранением огромных файлов с полнометражными видеофайлами в формате HD, то неудивительно, что Netflix «поселили» «Лос-Анджелесскую историю» в Лос-Анджелесе, то есть там, где живут ее герои и, что еще важнее, ее фанаты.
Назад: Вывернуть библиотеку наизнанку
Дальше: Кеширование в тылу