Книга: Голая статистика
Назад: ГЛАВА 13. Программы статистического оценивания. Изменит ли вашу жизнь поступление в Гарвардский университет
Дальше: ПРИЛОЖЕНИЕ. Статистическое программное обеспечение

Заключение

Пять вопросов, на которые поможет ответить статистика

Еще не так давно информацию было гораздо труднее собирать и гораздо дороже анализировать. Вообразите, каких титанических усилий стоило изучить данные о миллионе транзакций по кредитным картам при отсутствии (а ведь это было всего лишь несколько десятков лет тому назад!) персональных компьютеров, позволяющих оперативно это сделать, и наличии исключительно бумажных товарных чеков. Во время Великой депрессии не существовало официальной статистики, помогающей оценить глубину экономических проблем. Правительство не собирало официальную информацию о валовом внутреннем продукте (ВВП) и безработице, поэтому руководители государства ориентировались в экономической ситуации примерно так же, как человек, не имеющий компаса, в незнакомом лесу. В 1930 году Герберт Гувер, исходя из неточных и устаревших данных, имевшихся в его распоряжении, объявил об окончании Великой депрессии. В своем послании о положении в стране он сообщил ее гражданам о двух с половиной миллионах безработных, хотя на самом деле их было пять, причем это число каждую неделю увеличивалось на сто тысяч. Недавно Джеймс Суровецки написал в еженедельнике The New Yorker, что «Вашингтон вершил тогда свою политику втемную».

Сейчас у нас нет недостатка в данных. И по большому счету это благо. Статистические инструменты пригодятся вам для решения ряда самых острых социальных проблем. Именно поэтому я счел уместным завершить книгу вопросами, а не ответами. Когда будете анализировать огромные объемы информации, не забывайте о пяти важных (и на первый взгляд не связанных друг с другом) вопросах, получение социально значимых ответов на которые предполагает использование многих инструментов, описанных в этой книге.

Какое будущее ждет американский футбол?

В 2009 году Малкольм Гладуэлл в одной из статей, опубликованных в The New Yorker, поставил вопрос, который сначала мне показался нарочито сенсационным и провокационным: чем отличаются собачьи бои от футбола? Связь между тем и другим проистекает из того обстоятельства, что куортербек Майкл Вик, в свое время отсидевший в тюрьме за участие в организации собачьих боев, был восстановлен в Национальной футбольной лиге после того, как стало известно, что травма головы, полученная им во время футбольного матча, впоследствии могла вызвать депрессию, частичную потерю памяти, слабоумие и прочие неврологические проблемы. Ключевая мысль Малкольма Гладуэлла, которую он хотел подчеркнуть, состояла в том, что общим для профессионального футбола и собачьих боев является оказываемое ими разрушительное воздействие на психику их участников. Дочитав статью Гладуэлла до конца, я пришел к выводу, что ее автор поднял очень интересную тему.

Вот что об этом известно. Существуют многочисленные доказательства, что сотрясения мозга и другие травмы, связанные с игрой в футбол, могут вызывать серьезные и долговременные неврологические расстройства. (Аналогичные явления наблюдаются у боксеров и хоккеистов.) Многие из известных профессиональных футболистов, завершивших карьеру, рассказывают о таких «постфутбольных» недугах, как депрессия, частичная потеря памяти и слабоумие. Пожалуй, наиболее впечатляющей можно считать историю Дейва Дайерсона, бывшего ключевого игрока команды Chicago Bears, который покончил жизнь самоубийством, выстрелив себе в грудь. Он завещал своей семье отдать его мозг на экспертизу. В ходе телефонного опроса тысячи случайно выбранных бывших игроков НФЛ старше пятидесяти лет (отыгравших в лиге не менее трех сезонов) 6,1% из них сообщили, что у них диагностировали слабоумие, болезнь Альцгеймера или какое-то другое заболевание, связанное с частичной потерей памяти. Это более чем в пять раз превышает соответствующий средний показатель в США для данной возрастной группы. Среди более молодых игроков частота подобного диагноза в девятнадцать раз превышает соответствующий средний показатель. Сотни бывших игроков НФЛ обвиняют руководство лиги и производителей футбольной экипировки (особенно это касается изготовителей шлемов) в сокрытии информации о реальной опасности травм головы.

Энн Макки — один из исследователей, изучающих влияние травм мозга, — руководит лабораторией нейропатологии в госпитале для ветеранов в Бедфорде. (Кроме того, Энн выполняет исследования в области нейропатологии в рамках Framingham Heart Study.) В ходе экспериментов д-р Макки выявила в мозге спортсменов (в частности, боксеров и профессиональных футболистов), перенесших травму мозга, накопление аномальных белков под названием тау, что приводит к состоянию, известному как хроническая травматическая энцефалопатия, или CTE, — прогрессирующему неврологическому заболеванию, у которого много таких же проявлений, как у болезни Альцгеймера.

Другие исследователи обнаружили связь между занятиями профессиональным футболом и травмами головного мозга. Кевин Гускевич, руководитель исследовательской программы Sport Concussion Research Program в Университете Северной Каролины, установил датчики внутри шлемов футболистов, выступающих за команду Северной Каролины, чтобы определить силу и природу получаемых игроками ударов по голове. Согласно данным Гускевича, футболисты регулярно получают удары по голове с силой, эквивалентной удару водителя головой о лобовое стекло при столкновении автомобиля с препятствием на скорости двадцать пять миль в час.

А вот то, чего мы не знаем. Являются ли имеющиеся сегодня сведения о травмах мозга репрезентативными с точки зрения долговременных неврологических рисков, с которыми приходится сталкиваться всем профессиональным футболистам? Или речь идет лишь о каком-то «кластере» неблагоприятных исходов, который представляет собой не что иное, как статистическую аберрацию? Даже если футболисты действительно подвержены повышенному риску развития неврологических заболеваний по завершении профессиональной карьеры, нам все же необходимо проверить наличие соответствующей причинно-следственной связи. Не может ли так случиться, что мужчины, играющие в футбол (а также те, кто занимается боксом или хоккеем), склонны к развитию таких болезней в силу определенных особенностей своего организма? А вдруг еще какие-то факторы, например использование стероидов, влияют на подобный исход?

Если накопленная нами информация подтвердит наличие четкой причинно-следственной связи между занятиями профессиональным футболом и долговременными травмами мозга, то игрокам (а также родителям молодых игроков), тренерам, юристам, руководителям НФЛ и даже, возможно, государственным регуляторным органам придется найти ответ на следующий ключевой вопрос: нельзя ли изменить правила игры в футбол так, чтобы минимизировать (или вообще исключить) риск получения травмы головы? Если нет, то как тогда быть? Вот что в действительности скрывается за сравнением футбола и собачьих боев, которым меня поразил Малкольм Гладуэлл. Он объясняет, что собачьи бои вызывают протест общества потому, что владелец собаки осознанно подвергает своего питомца испытанию, кульминацией которого являются страдания, боль и даже смерть. «Для чего все это нужно? — спрашивает автор. — На потеху зрителям и ради шанса сорвать куш? В XIX столетии собачьи бои пользовались большой популярностью у американской публики. Но в наше время этот вид развлечения неприемлем по этическим соображениям».

Сегодня практически каждый тип статистического анализа, описанный в этой книге, используется для того, чтобы выяснить, есть ли будущее у профессионального американского футбола в его нынешнем виде.

Что вызывает резкий рост заболеваемости аутизмом в наши дни (если такая причина вообще существует)?

В 2012 году Centers for Disease Control сообщил, что у одного ребенка из каждых 88 американских детей диагностируется расстройство аутистического спектра (РАС) (этот вывод был сделан на основе данных за 2008 год). Таким образом, за менее чем десять лет частота диагностирования аутизма значительно (почти в два раза) повысилась по сравнению с «1 из 110» в 2006 году и «1 из 150» в 2002-м. Заболевания аутизмом (autism spectrum disorders — ASD) представляют собой группу заболеваний вследствие порока развития головного мозга, которые характеризуются проблемами с социализацией и общением, а также атипичным поведением. Слово spectrum («спектр») в названии этой группы заболеваний указывает на то, что аутизм охватывает широкий спектр состояний, определяемых поведением. Частота диагностирования РАС у мальчиков в пять раз выше, чем у девочек (это означает, что заболеваемость аутизмом у мальчиков даже выше, чем «1 из 88»).

Первый интригующий статистический вопрос таков: с чем мы имеем дело в данном случае? С эпидемией аутизма, «эпидемией диагностирования» или и тем и другим, вместе взятыми? В предыдущие десятилетия дети, страдающие аутизмом, имели симптомы, которые вообще могли не диагностироваться, а проблемы в развитии таких детей зачастую описывались как «неспособность к обучению». В наши дни врачи, родители и преподаватели гораздо больше осведомлены о симптомах РАС, что, естественно, приводит к увеличению случаев диагностирования аутизма независимо от того, действительно ли он стал встречаться гораздо чаще по сравнению с предыдущими десятилетиями.

В любом случае необычайно высокая заболеваемость аутизмом в наши дни представляет серьезную проблему для семей, школ и общества в целом. Средняя стоимость решения проблем, связанных с РАС, для отдельно взятого человека составляет 3,5 миллиона долларов. Несмотря на очевидно эпидемический характер данного заболевания, нам на удивление мало известно о причинах его возникновения. Томас Инзел, директор National Institute of Mental Health, говорит: «Может быть, виной всему мобильные телефоны? Ультразвук? Низкокалорийные газированные напитки? У каждого из родителей есть на сей счет собственная теория. Наука пока не может ответить на этот вопрос».

Чем особенным или уникальным характеризуется нынешняя жизнь детей, страдающих аутизмом? Каковы самые существенные физиологические различия между детьми-аутистами и обычными детьми? Является ли заболеваемость аутизмом разной в разных странах? Если да, то почему? Традиционная статистическая «детективная» работа позволяет найти ключи к ответам на эти вопросы.

Недавнее исследование, выполненное учеными Калифорнийского университета в Дэвисе, выявило в Калифорнии десять мест, где заболеваемость аутизмом вдвое превышает соответствующий показатель в соседних регионах; каждый из этих кластеров аутизма представляет собой территорию с плотной концентрацией белых родителей с высоким образовательным уровнем. Является ли это ключом к разгадке причин аутизма или речь идет о случайном совпадении? Или это отражает тот факт, что лишь относительно привилегированные семьи могут себе позволить затраты, связанные с диагностированием аутизма? Те же ученые проводят исследование, в ходе которого собирают образцы пыли в домах 1300 семей, где есть дети-аутисты, чтобы проверить эту пыль на наличие химических веществ или других загрязнений окружающей среды, которые могут вызывать заболевание аутизмом.

Другие исследователи идентифицировали возможный генетический компонент аутизма, исследовав РАС среди однояйцевых и двуяйцевых близнецов. Вероятность того, что двое детей в одной и той же семье больны аутизмом, выше среди однояйцевых близнецов (у которых одинаковая организация генетического материала), чем среди двуяйцевых (генетическое подобие которых такое же, как у обычных братьев или сестер). Это открытие не исключает влияния существенных факторов окружающей среды или возможного взаимодействия между ними и генетическими факторами. В конце концов, в заболеваниях сердечно-сосудистой системы присутствует значительная генетическая составляющая, но совершенно очевидно, что важную роль также играют курение, режим питания, физическая активность и многие другие поведенческие модели и факторы окружающей среды.

Одним из самых ощутимых вкладов, вносимых статистическим анализом, до сих пор считалась возможность развенчать ложные причины, многие из которых возникли из-за путаницы между корреляцией и причинно-следственными зависимостями. Аутизм зачастую внезапно проявляется между первым и вторым днями рождения ребенка. Это привело к широко распространенному мнению, будто вакцинация детей — особенно тройная вакцина от кори, свинки и краснухи (КСК) — является причиной роста заболеваемости аутизмом. Дэн Бартон, член Конгресса от штата Индиана, в интервью газете The New York Times рассказал: «Мой внук получил девять прививок в один день; семь из них содержали тимеросал, который, как известно, состоит на 50% из ртути. Спустя непродолжительное время у внука был диагностирован аутизм».

Ученые полностью опровергли ложную зависимость между тимеросалом и РАС. Когда тимеросал изъяли из вакцины КСК, заболеваемость аутизмом не снизилась; к тому же в странах, где эта вакцина никогда не применялась, заболеваемость аутизмом не ниже, чем в странах, где она регулярно используется. Тем не менее эта ложная связь укоренилась в сознании людей, что заставило некоторых родителей отказаться от вакцинации своих детей. Ирония судьбы в том, что это не обеспечивает защиты от аутизма, но зато подвергает детей риску подхватить другие серьезные болезни (и способствует их распространению среди остального населения).

Аутизм — одна из величайших медицинских и социальных проблем нашего времени. А мы так мало знаем о нем по сравнению с его огромным (и, возможно, растущим) влиянием на наше общее благополучие. Исследователи используют буквально каждый из инструментов, описанных в этой книге (а также многие другие), чтобы изменить нынешнее положение вещей.

Как выявить и наградить хороших преподавателей и хорошие школы?

Безусловно, нам нужны хорошие школы, так же как нам нужны и хорошие преподаватели, без которых такие школы невозможны. Следовательно, нам нужно вознаграждать хороших преподавателей и хорошие школы, а также увольнять плохих преподавателей и закрывать плохие школы.

Но как выявить хороших преподавателей и хорошие школы?

Результаты сдачи экзаменов могут служить объективным показателем успеваемости учащихся. Тем не менее мы знаем, что некоторые ученики сдают стандартизованные тесты лучше своих сверстников по причинам, не имеющим ничего общего с тем, что происходит в стенах конкретного класса или школы. Казалось бы, самым простым решением здесь стало бы оценивание школ и преподавателей на основе прогресса, которого добиваются учащиеся за определенный период времени. Как изменились их знания с момента начала их занятий в определенном классе у конкретного преподавателя? Какими они были год назад? Разница между этими объемами знаний представляет собой «добавленную стоимость» соответствующего класса.

Чтобы получить более точное представление об этой «добавленной стоимости», мы можем воспользоваться статистическими инструментами, приняв во внимание демографические характеристики учащихся в конкретном классе, такие как расовая принадлежность, уровень дохода в семье и успеваемость по другим тестам (что может быть показателем сообразительности). Если преподаватель добился значительных успехов в работе с учащимися, которые не блистали знаниями в прошлом, то его следует считать весьма эффективным.

Вот так-то! Теперь мы можем оценить качество учителя со статистической точностью. А хорошие школы — это, безусловно, школы, где работают такие учителя.

Как эти удобные статистические оценки функционируют на практике? В 2012 году городские власти Нью-Йорка проявили инициативу и опубликовали рейтинги всех 18 000 преподавателей государственных школ на основе «оценки добавленной стоимости», измеренной по результатам сдачи экзаменов учениками с учетом их различных характеристик. Газета Los Angeles Times опубликовала аналогичную совокупность рейтингов преподавателей Лос-Анджелеса в 2010 году.

И в Нью-Йорке, и в Лос-Анджелесе реакция на эти публикации была бурной и противоречивой. Арни Дункан, министр образования США, в целом поддержал такого рода оценки на основе «добавленной стоимости», заявив, что они хороши хотя бы тем, что позволяют получить какую-то информацию в областях, где раньше ее вообще не было. После публикации данных по Лос-Анджелесу Арни Дункан сказал газете The New York Times: «Молчание — это вообще не вариант». Администрация Обамы предоставила штатам финансовые средства для разработки показателей добавленной стоимости, на основе которых можно было бы оплачивать труд преподавателей и продвигать их по службе. Сторонники данных способов оценивания подчеркивают, что это огромный шаг вперед по сравнению с системами, в которых труд всех преподавателей оплачивается в соответствии с единой шкалой окладов, не учитывающей такие «мелочи», как профессионализм.

С другой стороны, многие эксперты предупреждают, что подобные системы оценивания характеризуются большими допустимыми пределами погрешности и могут давать ошибочные результаты. Профсоюз преподавателей Нью-Йорка потратил более 100 000 долларов на рекламную кампанию в газетах, проводившуюся под лозунгом «Так оценивать работу преподавателей нельзя». Оппоненты утверждают, что «оценивание добавленной стоимости» создает ложное впечатление высокой точности, причем такие оценки могут вольно трактоваться родителями и государственными чиновниками, не понимающими ограничений подобного оценивания.

Похоже, это тот самый случай, когда правы — в определенной степени — и те и другие. Даг Стайгер, экономист Дартмутского колледжа, широко использующий в работе данные «добавленной стоимости» преподавателей, предостерегает, что в этих данных, в силу самой их природы, многовато «шума». Результаты по конкретному учителю зачастую основываются на результатах одного экзамена. При этом действие множества разнообразных факторов — от особенно «трудной» группы учащихся до сломавшегося в день сдачи экзамена кондиционера в классе — может вести к флуктуациям. Корреляция в эффективности отдельно взятого преподавателя, которая использует эти индикаторы, от года к году составляет лишь 0,35. (Интересно, что корреляция в эффективности игроков Высшей бейсбольной лиги от года к году также составляет примерно 0,35; для хиттеров она измеряется средним уровнем достижений, а для питчеров — средним числом зачетных пе­ребежек.)

По мнению Стайгера, данные об эффективности учителей полезны, но это лишь один из инструментов, применяемых в процессе оценивания их профессионализма. Эти данные оказываются «менее шумными», когда исследователи располагают информацией по конкретному преподавателю за много лет, особенно если он работал с разными группами учащихся (точно так же, как мы можем сделать более достоверные выводы о достижениях спортсмена, имея данные о большем числе игр и сезонов, в которых он участвовал). В случае рейтингов преподавателей Нью-Йорка руководство системы образования предупреждало о необходимости правильного использования данных «добавленной стоимости» и о присущей им ограниченности. Однако широкой общественности не было известно об этих предупреждениях. В результате предложенные оценки учителей зачастую рассматриваются как определитель «хороших» и «плохих» преподавателей, заслуживающий полного доверия. Нам вообще нравятся рейтинги — вспомните хотя бы рейтинги колледжей, опубликованные в U.S. News & World Report, — даже когда соответствующие данные не поддерживают такую точность.

Стайгер делает предупреждение несколько иного рода: нам следовало заранее удостовериться в том, что оцениваемые нами исходы (например результаты стандартизированного теста) действительно соответствуют тому, что нас интересует в долгосрочной перспективе. Некоторые уникальные данные, которые приводит Академия ВВС США, свидетельствуют о том, что блестящие результаты экзаменов в будущем могут такими не казаться. Академия ВВС США, подобно другим военным учебным заведениям, произвольно распределяет своих кадетов по разным секциям стандартизированных базовых курсов, таких как введение в математический анализ. Подобная рандомизация устраняет любое влияние потенциального отбора при сравнении эффективности преподавателей; спустя какое-то время мы можем исходить из того, что все преподаватели получают студентов с примерно одинаковыми способностями (в отличие от большинства университетов, где студенты с разными способностями могут выбирать для себя те или иные курсы). Кроме того, Академия ВВС США использует в каждой части конкретного курса одинаковые учебные программы и экзамены. Скотт Каррелл и Джеймс Уэст, профессора Калифорнийского университета в Дэвисе и Академии ВВС США, воспользовались этой элегантной системой организации процесса подготовки студентов, чтобы ответить на один из самых важных вопросов в высшем образовании: какие из профессоров самые эффективные?

Ответ: профессора с меньшим опытом преподавательской работы и меньшим числом научных степеней от новомодных университетов. Студенты таких профессоров, как правило, очень позитивно отзываются о них и демонстрируют более высокие результаты сдачи стандартизированных тестов по вводным курсам. Понятно, что эти молодые и мотивированные преподаватели относятся к своей работе с большим энтузиазмом, чем старые, «замшелые» профессора с докторскими степенями от престижных университетов (например Гарвардского). Не исключено, что эти «старые зубры» все еще пользуются теми же пожелтевшими от времени конспектами лекций, что и в далеком 1978 году; возможно, они полагают, что PowerPoint — это нечто вроде энергетического напитка (правда, они могут и не знать, что это такое). Очевидно, эти данные говорят нам о том, что этих «динозавров» давно пора уволить или по крайней мере предоставить им шанс красиво уйти со сцены.

Впрочем, не будем торопиться. И спешить с увольнениями. Опыт Академии ВВС США позволил сделать еще один важный вывод — об успеваемости студентов на более протяженном горизонте. Скотт Каррелл и Джеймс Уэст выяснили, что в области математики и точных наук студенты, у которых были более опытные (и более титулованные) преподаватели вводных курсов, демонстрируют лучшую успеваемость в последующих обязательных курсах, чем студенты, обучавшиеся у менее опытных преподавателей вводных курсов. Одно из логических объяснений заключается в том, что менее опытные преподаватели в большей степени склонны «натаскивать на экзамен» по соответствующему вводному курсу. Это приносит впечатляющие результаты на экзаменах и моральное удовлетворение студентам, что выливается в высокие оценки, которые они выставляют своим преподавателям.

Между тем, старые замшелые профессора (которых мы уже были готовы уволить) уделяют меньше внимания экзаменам, сосредоточиваясь на важных положениях своего курса, что положительно влияет на успеваемость студентов в процессе прохождения ими последующих обязательных курсов, а также в их практической деятельности по завершении учебы в Академии ВВС США.

Разумеется, мы должны оценивать деятельность школьных учителей и профессоров. Нам нужно лишь убедиться, что мы делаем это правильно. Задача на перспективу (коренящаяся в статистике) состоит в разработке такой системы, которая вознаграждала бы реальную добавленную стоимость преподавателя, создаваемую им для учеников.

С помощью каких инструментов лучше всего бороться с глобальной бедностью?

Мы очень мало знаем о том, как сделать бедные страны богаче. Да, мы понимаем, что отличает богатые страны от бедных, например уровень образования и качество кадров, управляющих бедными странами. Правда и то, что за последние несколько десятилетий такие страны, как Индия и Китай, совершили радикальные преобразования в области экономики. Но даже при наличии этих знаний мы не можем с уверенностью сказать, какие шаги следует предпринять, чтобы повысить уровень благосостояния таких стран, как Мали и Буркина-Фасо. С чего же начать?

Французский экономист Эстер Дафло трансформирует знания о глобальной бедности путем использования старого инструмента для решения новых задач. Речь идет о статистическом управляемом эксперименте. Дафло — преподаватель Массачусеттского технологического института — в буквальном смысле проводит эксперименты с разными формами воздействия, пытаясь улучшить жизнь бедняков в развивающихся странах. Например, одна из давних проблем школ в Индии — прогулы учителей; особенно это касается небольших провинциальных школ с единственным учителем. Дафло и ее соавтор Рема Ханна провели тестирование на основе использования технологий на произвольной выборке из 60 школ с единственным учителем в индийском штате Раджастхан. Учителям в этих 60 экспериментальных школах был предложен определенный бонус за работу без прогулов. Вот креативная часть этого проекта: учителям были вручены фотокамеры с защитой от несанкционированного вмешательства и временными отметками. Это позволяло учителям каждый день доказывать свое присутствие на уроках, делая групповую фотографию с учениками.

В результате прогулы среди учителей в экспериментальных школах сократились наполовину по сравнению с учителями в произвольно выбранной контрольной группе из 60 школ. Результаты сдачи экзаменов учениками тоже заметно улучшились: в следующий класс перешло намного больше учеников. (Полагаю, групповые фотографии также были очаровательны!)

Один из экспериментов, проведенных Дафло в Кении, предполагал выдачу произвольно выбранной группе фермеров небольшой субсидии на покупку удобрений непосредственно после уборки урожая. Предыдущая практика показывала, что внесение удобрений существенно повышает урожайность. Фермеры знали об этом, но каждый раз, когда наступало время сева, у них не оставалось достаточно денег от продажи прошлого урожая, чтобы закупить удобрения. В результате фермеры попадали в так называемую ловушку бедности: они были слишком бедны, чтобы что-то сделать для повышения своего благосостояния. Дафло и ее соавторы пришли к выводу, что даже очень небольшая субсидия — бесплатная раздача удобрения, — предлагаемая фермерам, когда у них еще остаются деньги после уборки урожая, повышала использование удобрений на 10–20% по сравнению с использованием удобрений в контрольной группе.

Эстер Дафло даже умудрилась ввязаться в «войну полов». Кто проявляет большее чувство ответственности в деле управления семейными финансами — мужчины или женщины? В богатых странах супружеские пары нередко ссорятся по этому поводу, в связи с чем им подчас даже приходится обращаться за услугами к консультантам-психологам. В бедных странах от этого может зависеть (в буквальном смысле), будут ли сыты дети. Многочисленные свидетельства, дошедшие до нас из глубин истории человеческой цивилизации, указывают на то, что женщины считают здоровье и благополучие детей одним из важнейших приоритетов, тогда как мужчины в большей степени склонны пропивать зарплату в местном пивбаре (или проводить время за каким-нибудь другими, не менее приятными занятиями, которые мужчины находили для себя даже в каменном веке). В худшем случае эти факты лишь подкрепляют давно сложившиеся стереотипы. В лучшем это не так-то легко доказать, поскольку семейные финансы в той или иной степени находятся в совместном распоряжении мужа и жены.

Но этот деликатный вопрос не смущает Эстер Дафло. Напротив, она выявила впечатляющий натурный эксперимент. В Кот-д’Ивуаре муж и жена, как правило, несут общую ответственность за выращивание определенных сельскохозяйственных культур. В силу давно устоявшихся традиций мужчины и женщины также выращивают разные товарные культуры. (Для мужчин это обычно какао, кофе и некоторые другие сельскохозяйственные культуры.) С точки зрения исследователя такой подход к ведению сельского хозяйства интересен тем, что урожаи «мужских» и «женских» сельскохозяйственных культур в разные годы бывают разными, что определяет появление у мужчин или женщин дополнительных денег от продажи «своего» урожая. В годы, когда удается собрать хороший урожай кофе или какао, дополнительные деньги заводятся в карманах мужчин. В годы, урожайные для кокосов и бананов, дополнительный заработок появляется у женщин.

Теперь нам впору задать деликатный вопрос: в какие годы дети в таких семьях живут сытнее? В годы, когда удается собрать хороший урожай «мужских» сельскохозяйственных культур, или когда обильный урожай собирают женщины?

К большому стыду мужчин, ответ будет следующим: когда хороший урожай собирают женщины, они тратят часть своих дополнительных доходов на бюджет семьи, чего не скажешь о мужчинах. Увы!

В 2010 году Дафло наградили медалью John Bates Clark Medal; ее вручает Американская экономическая ассоциация лучшему экономисту не старше сорока лет. Среди экономистов эта награда считается даже более престижной, чем Нобелевская премия в области экономики, поскольку она вручается лишь раз в два года. (Правда, после получения этой медали Эстер Дафло в 2010 году награждение теперь проводится ежегодно.) Как бы то ни было, присуждение John Bates Clark Medal для людей, которые носят очки с толстыми линзами (как вам моя метафора?!), аналогично признанию «самым ценным игроком» в спорте. Дафло занимается программами оценивания. Ее работа, как и работа тех, кто сейчас использует ее методы, меняет жизнь малоимущих людей в лучшую сторону. С точки зрения статистики работа Дафло побуждает нас шире применять статистические управляемые эксперименты — которые давно считались преимущественной сферой деятельности лабораторных наук — для выявления причинно-следственных связей во многих областях нашей жизни.

Кто и что знает о вас?

Прошлым летом я нанял для своих детей новую няню. Когда она к нам пришла, я решил рассказать ей немного о нашей семье: «Я — профессор, моя жена — преподаватель…»

«Спасибо, мне уже все известно, — махнула няня рукой. — Я вас прогуглила».

С одной стороны, я испытал некоторое облегчение, поскольку мне не нужно было произносить заранее заготовленную речь. С другой — меня несколько насторожило то, как много можно обо мне узнать, пошарив часок-другой в сети. Наша нынешняя способность собирать и анализировать огромные объемы данных, появившаяся в результате объединения цифровой информации с дешевой вычислительной мощностью и интернетом, представляет собой поистине уникальное явление в истории человечества. Для этой новой эпохи необходим ряд новых правил.

Чтобы сегодня оценить потенциал имеющихся у нас данных, достаточно рассмотреть пример сети розничной торговли Target. Подобно большинству компаний, Target стремится повысить прибыль за счет лучшего понимания своих клиентов. Для этого она нанимает специалистов по статистике, перед которыми ставится задача выполнить своего рода «упреждающий анализ» (о нем уже упоминалось в этой книге); они используют данные продаж в сочетании с другой информацией о потребителях, чтобы выяснить, кто, что и почему покупает. Ничего изначально плохого во всем этом нет: просто это означает, что ближайший к вам магазин Target хочет знать, что вам как потребителю может понадобиться.

Но давайте рассмотрим хотя бы один пример того, что могут «вычислить» специалисты по статистике, обосновавшиеся в плотно зашторенных комнатах цокольного этажа корпоративной штаб-квартиры. Target выяснила, что беременность — особенно важное время с точки зрения построения моделей покупательского поведения. У беременных женщин вырабатываются определенные «отношения с розничной торговлей», которые могут длиться десятилетиями. В результате Target хочет выявить беременных женщин — особенно тех, кто на четвертом–шестом месяцах, — и заманить их в свои магазины, чтобы они посещали их как можно чаще. Один из журналистов The New York Times Magazine наблюдал за тем, как бригада специалистов по упреждающему анализу компании Target пыталась это сделать.

Первая часть задачи решалась достаточно просто. У Target есть специальный реестр, в котором беременные женщины регистрируются, чтобы еще до рождения ребенка приобрести все товары, необходимые для новорожденного. Эти женщины уже являются клиентками Target, и они, по сути, сами сообщают магазину о своей беременности. Но здесь есть одна статистическая уловка: компания «вычислила», что другие женщины, которые демонстрируют аналогичное покупательское поведение, также, вероятно, беременны. Например, беременные женщины зачастую переходят на использование неароматизированных лосьонов, начинают покупать витаминные добавки, огромные упаковки ватных тампонов. Специалисты по упреждающему анализу компании Target выявили двадцать пять наименований товаров, которые в совокупности составляют «признак, позволяющий предсказать беременность». Цель этого анализа заключалась в том, чтобы послать беременным женщинам соответствующие купоны в надежде сделать их постоянными покупательницами Target.

Насколько эффективной оказалась данная стратегия? The New York Times Magazine поведал своим читателям историю о мужчине из Миннеаполиса, который зашел в один из магазинов Target, чтобы поговорить с менеджером. Мужчина был разгневан тем, что Target буквально бомбардировал его дочь-старшеклассницу купонами для беременных женщин. «Она еще учится в школе, а вы присылаете ей купоны на детские кроватки и одежду для новорожденного! Может быть, вы предлагаете ей побыстрее забеременеть?!» — возмущался мужчина.

Менеджер извинялся и заверял мужчину, что это не более чем досадная ошибка. Через несколько дней менеджер еще раз позвонил этому мужчине, чтобы извиниться. На сей раз мужчина вел себя гораздо спокойнее и в свою очередь тоже посчитал нужным извиниться. «Понимаете, у меня в доме небольшой переполох, — сказал он. — Одним словом, она должна родить в августе».

Статистики Target узнали, что его дочь беременна, раньше, чем он!

Может быть, они суют нос не в свои дела — или все-таки это их дела? Иногда складывается впечатление, что их внимание к нам чрезмерно. Именно поэтому некоторые компании пытаются делать вид, что знают о нас гораздо меньше, чем им известно на самом деле. Если, например, вы — женщина и находитесь на четвертом–шестом месяце беременности, то в вашем почтовом ящике могут появиться купоны на детскую кроватку и бумажные полотенца — вместе с предложением скидки на газонокосилку и купоном на бесплатные носки для боулинга (при условии покупки любой пары обуви для боулинга). Появление в вашем почтовом ящике купонов для беременных в сочетании с рекламой других товаров, не имеющих никакого отношения к беременности, может показаться вам чистой случайностью. В действительности компания знает, что вы не увлекаетесь боулингом и не стрижете лужайку перед домом. Просто она пытается «замести следы», делая вид, что знает о вас гораздо меньше, чем ей известно на самом деле.

Facebook, компания, у которой практически нет физических активов, стала одной из самых дорогих в мире. С точки зрения инвесторов (в отличие от пользователей), Facebook располагает одним колоссальным активом — данными. Инвесторам не нравится Facebook, поскольку из-за этой компании они иногда наталкиваются в сети на своих бывших одноклассниц. Инвесторам нравится Facebook, так как каждый щелчок мышью приносит им данные о месте проживания пользователей, о магазинах, где они обычно совершают покупки, о том, какие покупки они делают, и о том, кого они знают и как проводят свободное время.

Крис Кокс, производственный вице-президент Facebook, сказал в интервью The New York Times: «Проблема информационной эпохи заключается в том, как распорядиться информацией».

Вот так-то.

Что же касается публичной сферы, то слияние данных и технологий порождает еще большие проблемы. Во многих крупных городах мира в общественных местах установлены тысячи камер видеонаблюдения, многие из которых вскоре будут обладать способностью распознавать лица людей. Правоохранительные органы могут отслеживать маршрут движения любого автомобиля, куда бы он ни направлялся (и сохранять соответствующую информацию в архивной памяти), прикрепляя к автомобилю то или иное устройство глобального позиционирования, а затем отслеживая его перемещения с помощью спутника. Является ли это достаточно дешевым и эффективным способом слежения за действиями преступных элементов? А может быть, это не что иное, как использование государством современных технологий для ограничения нашей личной свободы? В 2012 году Верховный суд США единогласно постановил, что это действительно посягательство на нашу свободу, и запретил правоохранительным органам прикреплять устройства слежения на личные транспортные средства без соответствующего ордера.

Между тем, многие государства обзавелись огромными базами данных ДНК, которые являются мощным инструментом, позволяющим раскрывать уголовные преступления. Чьи ДНК должны храниться в таких базах данных? Всех осужденных преступников? Каждого, кто подвергался аресту (даже если впоследствии был признан невиновным)? Или всех граждан без исключения?

Мы лишь приступаем к решению проблем, которые находятся на пересечении технологий и персональных данных. Ни одна из них не была настолько актуальна, когда соответствующая информация хранилась на пыльных стеллажах в подвалах серьезных государственных учреждений, а не в цифровых базах данных, в которые в принципе может забраться любой желающий. Статистика в наши дни играет даже более важную роль, чем когда-либо прежде, поскольку сейчас у нас появилось больше возможностей для эффективного использования данных. Однако сами по себе формулы не подскажут нам наилучшие способы их использования. Иными словами, математика не может заменить суждение.

Учитывая вышесказанное, давайте завершим эту книгу, попытавшись найти связь между следующими словами: огонь, ножи, автомобили, крем для удаления волос. Каждая из этих вещей служит важной цели. Каждая делает нашу жизнь лучше. И каждая может создать серьезные проблемы в случае неосторожного с ней обращения.

Теперь вы можете добавить статистику в этот список. Она наверняка поможет вам лучше понять многие явления нашей жизни при условии, что вы будете пользоваться статистическими инструментами разумно и по назначению!

Назад: ГЛАВА 13. Программы статистического оценивания. Изменит ли вашу жизнь поступление в Гарвардский университет
Дальше: ПРИЛОЖЕНИЕ. Статистическое программное обеспечение

Рауан
Хорошая книга