Книга: Неизведанная территория. Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры
Назад: Что можно купить за славу
Дальше: Слава как болезнь

Правильный шаг Райтов

Что такое слава? Подобно энергии или жизни, слава – это повседневная концепция, которую мы все интуитивно улавливаем, но редко можем дать четкое определение (произнося свою знаменитую фразу о порнографии: «Я узнаю ее, если увижу», судья Поттер Стюарт мог бы с тем же успехом говорить о славе) . Очевидно также, что слава бывает различной, – все знают, что Иисус более знаменит, чем певец Джон Леннон, что Леннон более знаменит, чем актер Алек Болдуин, и что Болдуин более знаменит, чем чемпион по поеданию хот-догов на скорость Такеру Кобаяси. Но, опять-таки, нам сложно дать четкое определение тому, что значит быть «более знаменитым». Славу, как любовь и красоту, сложно описать в конкретных терминах и еще сложнее измерить. Однако если мы надеемся понять суть славы, для нас крайне важно понять, как ее измерять. При этом измерение – это не просто решение интеллектуальной задачи, но и отличный инструмент, позволяющий сорвать покров тайны с понятий, которые кажутся нам неоднозначными и изменчивыми.

Возьмем, к примеру, саму концепцию полета. В 1903 году благодаря современным достижениям в автомобилестроении работы в области авиационной техники находились на подъеме. В те времена еще не было гаражей (n-грама для слова garage не существовало до 1906 года), но если бы они были, то в каждом из них сидел бы изобретатель, стремящийся построить первый аэроплан – устройство тяжелее воздуха, способное оторваться от земли благодаря собственному двигателю и совершить контролируемый полет. Существовавшие на тот момент машины для этого не подходили. Они либо не могли оторваться от земли, либо сразу же разрушались. Большинство изобретателей верило, что проблема связана с двигателем и что если им удастся создать подходящий двигатель, то они смогут реализовать свою мечту о полете.

Однако Орвилл и Уилбур Райты, два велосипедных механика с северо-запада, смотрели на проблему иначе. Братья Райт считали, что реальная проблема связана с крыльями. С их точки зрения, при отсутствии достойных крыльев им не помог бы никакой хороший двигатель. В то время уже было выдвинуто немало обширных математических теорий о том, как должны работать крылья. Однако, изучив теорию, Райты поняли, что она не соответствовала тому, что они видели в ходе своих неудачных экспериментов. Они решили, что когда дело касается крыльев, то у любой теории есть свои пределы. Теория была основана на определенных предположениях о физическом мире, и эти предположения могли быть ошибочными. Поэтому проблема состояла не в теории, а в измерениях. Райтам нужен был способ изучения аэродинамики крыла экспериментальным образом – для создания опытных образцов и быстрого измерения результативности их конструкций.

Поэтому, невзирая на сильную конкуренцию, братья Райт пошли на вполне рассчитанный риск. Вместо того чтобы углубиться в полетные тесты, они заперлись в задней комнате своего велосипедного магазина в Дейтоне, штат Огайо. Там они провели несколько месяцев за созданием точного инструмента для измерения параметров крыльев. В результате появился небольшой бензиновый мотор, создававший постоянный поток воздуха в прилегавшей к нему деревянной камере длиной около двух метров – аэродинамической трубе. С ее помощью Райты могли быстро измерять параметры различных конструкций крыльев, в точности оценивая подъемную силу и силу притяжения для каждой из них. Разумеется, их измерения работоспособности крыльев в аэродинамической трубе были упрощением, неидеальной и несовершенной симуляцией реальной работы реального крыла на реальном самолете в реальном полете. Однако они посчитали, что плохие данные все равно лучше, чем полное их отсутствие. Если ваш самолет постоянно терпит аварии, то лучше использовать хоть какой-то показатель для измерения, чем полагаться на интуицию, навыки и хороший огнетушитель.

Оказалось, что этот неожиданный шаг стал решающим. Он позволил им одновременно исправить теорию и шагнуть за ее пределы. Как позднее вспоминал Уилбур Райт, «трудно переоценить важность всей кропотливой работы, которую мы проделали с самодельной аэродинамической трубой. Благодаря данным, которые мы с Орвиллом свели в таблицы, наконец стало возможным создать надежное крыло правильной формы. И как бы знамениты мы ни стали благодаря нашему самолету и его системам контроля, он не был бы возможен без создания аэродинамической трубы и полученным благодаря ей точным аэродинамическим данным».

Оказалось, что благодаря аэродинамической трубе Райтов – довольно простой – удалось измерить массу важных аспектов, улучшающих работу крыла. Братья могли тестировать в своей трубе работоспособность одной конструкции за другой. Получив итоговые данные, они выстроили оптимальную конструкцию крыла и прикрепили ее к самолету. А затем утром 17 декабря 1903 года они вошли в историю.

Если мы хотим понять суть славы, нам тоже нужна аэродинамическая труба.

Почти знаменитые

Многие аспекты славы сложно измерить. Утрату анонимности. Давление, связанное с постоянным вниманием со стороны. Психологические последствия, связанные с угасанием звездного статуса.

Но что можно сказать относительно величины славы – ощущения того, что Иисус более знаменит, чем Леннон, который более знаменит, чем Болдуин, который более знаменит, чем Кобаяси? Важным аспектом величины славы является то, как часто вас упоминают другие люди, в том числе в книгах. А когда речь заходит об упоминаниях людей в книгах, нам на помощь приходят n-грамы.

Разумеется, с помощью n-грамов мы измеряем не славу саму по себе, а упрощение, некое факсимиле славы. Давайте пока что назовем это словом «флава». Нам предстоит ответить на вопрос, достаточно ли четко «флава» отражает подлинную славу, чтобы служить нам в качестве аэродинамической трубы?

Давайте начнем изучение этого вопроса со взгляда на Чарльза Диккенса, одного из самых знаменитых английских писателей. Его первое произведение, «Записки Пиквикского клуба», начиналось в 1836 году как сериал – то есть книга, публиковавшаяся по частям в периодических изданиях. После начала публикации «Записок» 2-грам «Чарльз Диккенс» начинает появляться все чаще. Подобно знаменитому самолету братьев Райт, «флава» Диккенса начала стабильно набирать высоту по мере того, как он последовательно создавал бестселлер за бестселлером, в том числе «Оливера Твиста» (1837), «Рождественскую песнь» (1843), «Дэвида Копперфильда» (1849), «Повесть о двух городах» (1859) и «Большие надежды» (1860). Влияние этих работ на культуру было огромным. Считается, что именно «Рождественская песнь» сделала популярным поздравление «Веселого Рождества», и это вполне соответствует данным n-грамов.

Как и в случае с Дикинсон, смерть Диккенса в 1870 году не привела к угасанию его «флавы». Вместо этого она взвилась до небес, а новости о его уходе из жизни заставили людей вновь восхититься его гением. За несколько десятилетий после смерти частота упоминания его имени достигла пика. Однако к 1900 году 2-грам «Чарльз Диккенс» начал медленное снижение. Несмотря на свою невероятную «популярность» даже в наши дни, интенсивность научного изучения его творчества и включение книг Диккенса в школьную программу, «флава» Диккенса начала плавно угасать в течение последнего столетия.





Добавив выражение «Чарльз Диккенс» в нашу аэродинамическую трубу, мы получили интересные результаты, позволяющие вполне точно измерить степень общественного интереса, возникшего к работам Диккенса.

Однако все не так просто. Наш пример также помогает определить расхождения между «флавой», измеренной с помощью книг, и славой, отраженной в наших интуитивных представлениях о культурной важности. Все измерительные приборы допускают ошибку. Чтобы лучше понять происходящее, нужно узнать больше о теории анализа ошибок, хорошо развитой области статистики, изучающей ошибки и проблемы измерений.

Статистики различают два типа ошибок, которые может совершить измерительный прибор. Первый тип называется случайной ошибкой и связан с колебаниями, которые возникают даже в случаях, если объект измерения не меняется. Такие ошибки видны в форме небольших пиков и долин в расчетах «флавы» (несмотря на их частое появление, они порой не имеют никакого смысла). Хорошая новость относительно случайных ошибок заключается в том, что, несмотря на все колебания, значение обычно остается близким к истинному.

Сложнее дело обстоит с так называемыми систематическими ошибками. Обычно они приводят к перекосу измерений в одном направлении (увеличивая или уменьшая результат). Например, наша процедура для измерения «флавы» основана на поиске имени человека. Однако это позволяет выявить лишь часть всех упоминаний. К примеру, отслеживая частоту фразы «Чарльз Диккенс», мы упускаем из внимания случаи, когда люди описывают его как «Диккенса», «Чарли» или «этого зануду». Не будут включены в результаты и описания Диккенса как автора «Записок Пиквикского клуба» или «мужа Кэтрин Хогарт». И, разумеется, мы не сможем добавить туда и случаи, когда кто-то хочет почтить память Диккенса, цитируя любимую строчку из его книги, описывая трюк иллюзиониста Дэвида Копперфильда или просто используя фразу «Веселого Рождества».

Отличной иллюстрацией проблемы, связанной с выявлением каждого упоминания Диккенса, был случай, когда Майкла Стила, кандидата на пост руководителя национального комитета Республиканской партии, попросили во время телевизионных дебатов 2011 года назвать свои любимые книги. Ответ Стила был на редкость неловким: «„Война и мир“ это было самое прекрасное время, это было самое злосчастное время». Цитата принадлежит Диккенсу, и с нее начинается «Повесть о двух городах». Однако «Война и мир» написана Львом Толстым. Так имел ли Стил в виду Диккенса или нет?

Подобная ситуация – когда мы пренебрегаем чем-то, что в идеале хотели бы включить в расчет, – носит название «систематической ошибки» или, выражаясь профессиональным языком статистиков, ситуации «ложного отрицания». В результате действия этого ложного отрицания показатель «флавы» обычно оказывается значительно меньше, чем истинная частота упоминаний о человеке.

Существует и еще один тип систематической ошибки, называемый «ложноположительной». Она возникает, когда мы включаем в расчеты то, чего включать не должны. К примеру, слова «Чарльз Диккенс» могут относиться и к старшему сыну Диккенса – писателю Чарльзу Диккенсу-мл.; его внуку Джеральду Чарльзу Диккенсу; двум из его правнуков – Седрику Чарльзу Диккенсу и Питеру Джеральду Чарльзу Диккенсу или же к актеру Джеральду Чарльзу Диккенсу (праправнуку писателя). С точки зрения расчета «флавы», все это будет относиться к патриарху семьи. Однако статистики знают, что тут-то и кроется опасность. Никакой статистик не понимает этого лучше, чем преподаватель Университета штата Калифорния в Беркли по имени Майкл И. Джордан. Чтобы понять, почему это так, вбейте в Google поисковый запрос «Майкл Джордан статистика» (Michael Jordan statistics).

Однако нам предстояло заняться еще более сложными статистическими проблемами, связанными с нашим измерительным прибором.

Обратимся к 1936 году. В этом году родились многие знаменитые люди, например Роберт Рэдфорд и Вацлав Гавел.

Рэдфорд – настоящая голливудская звезда. За последние пятьдесят лет он сыграл массу известных ролей в таких фильмах, как «Из Африки», «Афера» и «Вся президентская рать». Его внешность, почти не меняющаяся с годами, превратила его в одного из самых любимых и известных во всем мире деятелей культуры.

Вацлав Гавел представляет собой иной тип знаменитости. Он был тихим драматургом, который увел Чехословакию прочь от коммунизма, во времена «бархатной революции». Через четыре года он возглавил процесс мирного разделения Чешской и Словацкой республик. Гавел – одна из самых знаменитых политических и литературных фигур XX века.

Оба они входят в число 10 людей, родившихся в 1936 году и обладающих самым высоким уровнем «флавы». При этом ни один из них не занимает лидирующей позиции. Кто же оказался человеком с наибольшим показателем «флавы» из родившихся в 1936 году? Женщина по имени Кэрол Гиллиган.







Гиллиган – психолог и знаменитая феминистка, которая после проведения своих революционных исследований стала преподавать в Гарварде, Кембридже, а теперь еще и в Университете Нью-Йорка. Как и Пинкер, она входит в список самых влиятельных американцев, составленный журналом Time. Кэрол – настоящая интеллектуальная суперзвезда. И книг с упоминанием Кэрол Гиллиган написано много, значительно больше, чем о Вацлаве Гавеле или Роберте Рэдфорде. Если бы «флава» и слава были одним и тем же, то именно эта ученая дама была бы самым прославленным представителем своего поколения.

Но давайте будем реалистами. Кэрол Гиллиган знаменита не больше, чем Роберт Рэдфорд. О ней больше говорят в книгах, поскольку она представляет тип личности, интересный для создателей книг, – научная знаменитость и социальный критик. Однако она совсем не тот человек, события из жизни которого могли бы ежедневно освещаться в прессе. Ее портрет вряд ли будет висеть на рекламных щитах, и перед ней вряд ли будут преклоняться девочки-подростки.

Проблема состоит в том, что «флава» не отражает более масштабную картину. Если бы мы приняли во внимание упоминания в выпусках телевизионных новостей, рассказы в таблоидах и на интернет-сайтах, посвященных знаменитостям, или беседы в офисах во время перекуров, то было бы очевидно, что Гавел и Рэдфорд смогут затмить Гиллиган, причем с большим перевесом. Гиллиган занимает лидирующие позиции благодаря тому, что статистики называют ошибкой выборки, – аспект культуры, который мы измеряем с помощью «флавы», дает ей несправедливое преимущество. Это не подлинная слава.

Наша аэродинамическая труба не лишена своих недостатков. Однако они не уникальны. Они вполне вписываются в классическую ошибку, присущую любым измерительным инструментам, с которой ученые и статистики имели дело в течение десятилетий. Помня об этом несовершенстве, мы наверняка сможем разработать более качественные инструменты в будущем.

Связь между «флавой» и подлинной славой отлично иллюстрирует наш общий подход. Привычное для повседневной жизни понятие славы слишком сложно и слишком неточно, чтобы подчиняться количественному анализу. Поэтому мы ищем что-то, что можем измерить (например, «флаву»), и стараемся оставаться максимально близко к изначальной концепции. Результатом становится компромисс – мы создаем своего рода имитатора знаменитости, которого используем в роли подопытного кролика и подвергаем тщательно продуманным экспериментам. Как только в нашем распоряжении появятся более обширные массивы данных, включающие информацию из таблоидов, журналов и научных статей, измеряемая нами «флава» станет уже ненужной и вместо нее будут использоваться более изощренные альтернативы. Аэродинамическая труба Райтов не выдерживает никакого сравнения с турбинами LenSx, создающими поток ветра со скоростью 30 М для тестирования новых космических аппаратов.

Но пока что «флава» вполне подходит для наших целей. И теперь для упрощения давайте больше не будем говорить об этом различии, а станем просто использовать в дальнейшем рассказе слово «слава», ведь «почти знаменитый» – это «достаточно знаменитый».

Итак, что же мы, вооружившиеся новой аэродинамической трубой, можем узнать об аэродинамике взлета личности и механике приземления обратно?

Назад: Что можно купить за славу
Дальше: Слава как болезнь