Книга: Убийственные большие данные. Как математика превратилась в оружие массового поражения
Назад: К службе негоден: в поисках работы
Дальше: Небоевые потери: кредитная политика

Нервное расстройство: на работе

Работники больших корпораций в Америке недавно придумали новый термин ««заоткрытие»» (clope-ning) – это когда наемный сотрудник работает допоздна и поздно вечером, уходя последним, закрывает магазин или кафе, а через несколько часов приходит первым до рассвета, чтобы его открыть. Тот факт, что открывает и закрывает («заоткрывает») заведение один и тот же работник, имеет большой смысл с точки зрения логистики компании. Но для работника это означает дефицит сна у сотрудников и совершенно безумное рабочее расписание.

Такие нерегулярные расписания становятся все более массовым явлением, которое больше всего затрагивает низкооплачиваемых работников в компаниях вроде Starbucks, McDonald’s и Walmart. Отсутствие предварительных уведомлений лишь усугубляет проблему. Многие работники всего за день-два узнают, что им нужно будет выйти в ночь на среду или работать в пятницу, когда посетителей особенно много. Это вносит в их жизнь хаос и осложняет присмотр за детьми. Есть приходится буквально на ходу – как и спать.

Подобные нерегулярные расписания – один из плодов экономики данных. В предыдущей главе мы видели, как оружие математического поражения перебирает кандидатов на работу, кого-то при этом занося в черный список, но гораздо большее число – просто игнорируя. Мы видели, как в код программного обеспечения часто вписываются токсичные предубеждения – и в процессе обучения программа лишь усугубляет несправедливость. В этой главе мы продолжим путешествие по офисам и другим местам работы, где ОМП, полностью сконцентрированное на эффективности, третирует работников как винтики механизма. «Заоткрытие» – лишь одно проявление этой тенденции, которая, скорее всего, будет лишь усиливаться по мере распространения систем наблюдения на рабочих местах. А это, в свою очередь, будет еще больше подпитывать экономику данных.

В течение десятилетий, еще до того, как компании начали буквально купаться в данных, составление рабочих расписаний имело мало общего с наукой. Представьте себе семейное предприятие – например, маленький магазин хозяйственных товаров, работающий с девяти до пяти шесть дней в неделю. В один прекрасный день дочь владельцев магазина поступает в колледж. Приехав на лето домой, она смотрит на семейный бизнес свежим взглядом. И замечает, что практически никто не заходит в магазин по утрам во вторник. Продавщица спокойно сидит в своем смартфоне, и никто ее не прерывает. Здесь явно можно говорить о недополученной прибыли. Зато в субботу недовольные покупатели, ворча, стоят в длинной очереди к кассе.

Это наблюдение – ценная информация, и дочь помогает родителям подкорректировать семейный бизнес. Теперь магазин не работает по утрам во вторник, зато они нанимают еще одного продавца с частичной занятостью – помогать по субботам. Такие изменения делают косный и неповоротливый алгоритм работы чуть более разумным.

С наступлением эры Больших данных первокурсницу колледжа сменила армия ученых с мощными компьютерами. Компании теперь могут анализировать уровень наплыва посетителей, чтобы подсчитать, сколько именно работников им нужно в каждый час каждого дня. Цель, конечно, в том, чтобы потратить как можно меньше денег, а это означает, что штат нужно поддерживать на уровне абсолютного минимума – но при этом обеспечить подкрепление в самые оживленные часы. Можно было бы подумать, что эти паттерны будут повторяться из недели в неделю – что компании ограничатся легкими изменениями в установленном расписании, как произошло с хозяевами нашего гипотетического магазина хозтоваров. Но новые программы составления расписаний предлагают гораздо более сложные опции. Они обрабатывают потоки постоянно меняющейся информации – от погоды до закономерностей поведения. Например, в дождливый день люди, скорее всего, пойдут не в парк, а в кафе. Значит, этому кафе понадобится больше персонала, по крайней мере на час-другой. Школьный футбольный матч пятничным вечером может означать больше пешеходов на главной улице города, но только перед игрой и после ее окончания. Объем сообщений в Twitter позволяет предположить, что на завтрашние распродажи «черной пятницы» отправятся на 26 % больше покупателей, чем в прошлом году. Условия меняются каждый час, и рабочая сила должна быть задействована таким образом, чтобы отвечать на колебания спроса, иначе компания потеряет деньги.

Эти сэкономленные деньги, однако, изымаются напрямую из карманов наемных работников. При неэффективном прежнем расписании у работников не только были предсказуемые часы работы, но и определенный запас свободного времени на работе, которое они могли провести с пользой – почитать или даже позаниматься. Теперь, когда их работой управляют программы, они заняты каждую минуту рабочего времени. И эти минуты появляются в их расписании каждый раз, когда программа этого требует, – даже если это означает «заоткрытие» с пятницы на субботу.

В 2014 году газета The New York Times опубликовала историю замотанной матери-одиночки по имени Джанет Наварро, которая пыталась одновременно учиться в колледже и работать баристой в Starbucks, имея при этом четырехлетнего ребенка. Постоянно меняющееся расписание, включавшее в себя периодические «заоткрытия», сделало жизнь Джанет практически невыносимой и не позволяло ей даже отводить ребенка в детский сад и забирать его оттуда. Учебу тоже пришлось бросить. Единственным расписанием, которому подчинялась ее жизнь, было расписание ее рабочего дня. И эта история типична. Согласно данным официальной статистики, две трети работников общепита и более половины розничных продавцов узнают об изменениях в расписании за неделю или даже меньше – иногда за один-два дня, что очень сильно осложняет им жизнь, особенно уход за детьми.

В течение нескольких недель после публикации в The New York Times крупные корпорации, которые упоминались в статье, объявили, что скорректируют свою политику составления расписаний. Наниматели, пристыженные публикацией, пообещали добавить в свою модель одно ограничение: они искоренят «заоткрытия» и сделают оптимизацию чуть менее жесткой. Компания Starbucks, чей бренд сильнее, чем у многих других, ассоциируется со справедливым обращением с сотрудниками, пошла еще дальше и объявила, что изменит программу, чтобы уменьшить кошмар непредсказуемого расписания для всех своих 130 тысяч бариста. Все рабочие расписания будут публиковаться минимум за неделю.

Однако спустя год Starbucks так и не смогла сдержать обещания – и даже, согласно еще одной статье в New York Times, не смогла устранить «заоткрытия». Проблема заключалась в том, что к этому времени принцип минимального штатного расписания уже укоренился в корпоративной культуре. Во многих компаниях оплата менеджеров зависит от эффективности их подчиненных, которая рассчитывается как доход на час работы сотрудника. Программа, составляющая расписание (и минимизирующая персонал), позволяет увеличить цифры эффективности и, следовательно, собственную компенсацию менеджеров. Даже когда начальники велят менеджерам перейти к более мягкой политике, те зачастую сопротивляются. Это противоречит всему, чему их учили. Более того, как сказал газете один из сотрудников Starbucks, если менеджер кофейни выйдет за пределы бюджета трудовых затрат (labor budget), в известность ставится окружной менеджер. А это может повлечь взыскание. Гораздо проще изменить чье-то расписание, даже если это означает нарушение корпоративной политики – извещать минимум за неделю.

В конце концов, бизнес-модели открытых акционерных обществ вроде Starbucks настроены на то, чтобы максимизировать прибыль. Эта цель отражена в их корпоративной культуре и системе поощрений, а также, все сильнее и сильнее, в их оперативном ПО. И если в это ПО можно вносить изменения, как в случае со Starbucks, то эти изменения, скорее всего, тоже будут нацелены на увеличение прибыли.

Многое в технологии составления расписаний коренится в мощной дисциплине прикладной математики, которая называется «исследование операций». В течение столетий математики использовали примитивные методы исследования операций, чтобы помогать фермерам планировать посевы, а инженерам-строителям – проектировать автомагистрали для максимально эффективной перевозки людей и товаров. Но по-настоящему эта дисциплина получила развитие только во время Второй мировой войны, когда американская и британская армии подключили математиков к оптимизации использования ресурсов. Союзники отслеживали разные формы «курсового коэффициента»: соотношения потраченных ресурсов союзников и уничтоженных ресурсов врага. В ходе операции «Голод», проведенной с марта по август 1945 года, Двадцать первому бомбардировочному авиационному соединению была поставлена задача не пропускать транспорты с продовольствием и другими товарами к берегам Японии. Команды математиков работали над тем, чтобы минимизировать число самолетов, ставивших морские мины, на каждый затопленный японский корабль. Они умудрились выйти на «курсовой коэффициент» более 40 к одному: в ходе затопления 606 японских кораблей было потеряно всего 15 самолетов. Это было сочтено очень эффективным – и этого успеха позволила добиться в том числе работа команды математиков.

После Второй мировой войны крупнейшие компании (а также Пентагон) вложили в исследование операций огромные ресурсы. Научная организация логистики радикально изменила способ получения товаров и вывода их на рынок.

В 1960-е годы японские автомобильные компании совершили очередной прорыв, разработав производственную систему под названием «Точно в срок». Идея заключалась в том, чтобы вместо хранения огромных запасов рулей или коробок передач на складах сборочный цех заказывал их по мере необходимости, а не про запас. Toyota и Honda построили сложные цепочки поставщиков, каждый из которых был способен быстро подвозить запчасти по требованию. Индустрия работала как единый организм, с собственными гомеостатическими системами контроля.

Система «Точно в срок» оказалась очень эффективной и быстро распространилась по всему миру. Компании во многих странах могут запросто установить системы поставок «Точно в срок». Схожие модели составляют математическую основу работы таких компаний, как Amazon, Federal Express и UPS.

Программы, разрабатывающие расписание, можно воспринимать как продолжение экономики «Точно в срок». Только вместо лезвий газонокосилок или экранов мобильных телефонов, которые появляются на конвейере именно тогда, когда они нужны, здесь задействованы люди – причем обычно это люди, которые очень нуждаются в деньгах. Из-за этой отчаянной нужды компании имеют возможность подстраивать их жизни под требования своей математической модели.

Должна добавить, что компании при этом предпринимают кое-какие шаги, чтобы не делать жизни работников совсем уж ужасными. Они знают с точностью до пенни, сколько стоит заменить замотавшегося работника, который не выдержит напряжения и уволится. Эти цифры тоже занесены в базу данных. И у них есть еще и другие модели, предназначенные для того, чтобы снизить текучку, которая уменьшает доходы и эффективность (эти модели мы обсудим в последней главе).

Проблема, с точки зрения наемных работников, заключается в переизбытке предложения низкооплачиваемого труда. Люди с жадностью хватаются за любую работу – и именно поэтому держатся за места, на которых едва зарабатывают восемь долларов в час. Этот переизбыток, в сочетании с недостаточно эффективными профсоюзами, практически лишает работников возможности успешно бороться за лучшие условия. Это означает, что большие сети розничных магазинов и ресторанов могут назначать работникам все более абсурдные расписания, не боясь при этом, что сотрудники уволятся. Хозяева будут зарабатывать все больше, в то время как жизнь их работников будет становиться все более чудовищной. Из-за того, что программы оптимизации сейчас распространены повсеместно, работники отлично знают, что, даже поменяй они работу, в их жизни вряд ли что-то улучшится. В общем и целом эта динамика предоставляет к услугам корпорациям нечто очень похожее на рынок рабской, принудительной рабочей силы.

Уверена, никто не удивится, если я скажу, что считаю программы, составляющие расписание, одним из наиболее отвратительных видов ОМП. Как мы уже обсуждали, это оружие используется повсеместно – и эксплуатирует людей, которые и без того едва сводят концы с концами. Более того, оно полностью непрозрачно. Работники зачастую просто понятия не имеют, почему их вызвали на работу в неурочный час. Их вызвала деспотичная программа.

Программы, составляющие расписание, также создают токсичные петли обратной связи. Вспомним Джанет Наварро. Ее хаотичное расписание не позволило ей вернуться в колледж, что снизило ее шансы на лучшее трудоустройство в будущем и удержало в переполненной прослойке низкооплачиваемых работников. Кроме того, долгие и нерегулярные часы работы усложняют для работников возможность организовать протест и потребовать лучших условий. Вместо этого они начинают испытывать усиливающуюся тревожность и постоянный недосып, а это, в свою очередь, вызывает сильные перепады настроения и является установленной причиной 13 % смертельных случаев на автомагистралях. И еще хуже: поскольку программное обеспечение разработано таким образом, чтобы экономить компаниям деньги, оно часто ограничивает занятость работника менее чем 30 рабочими часами в неделю, а этого не хватает, чтобы получить от компании полис страхования здоровья. При этом, учитывая хаотичность расписания, большинство сотрудников не могут устроиться по совместительству на вторую работу. Складывается такое впечатление, что программы специально разработаны таким образом, чтобы наказывать низкооплачиваемых работников, не давая им подняться со дна.

Наконец, это оружие математического поражения обрекает большой процент наших детей на жизнь без нормального распорядка дня. За завтраком их мать сидит с остекленевшим взглядом из-за недостатка сна, вечером она выскакивает за дверь не поужинав, а ближе к выходным упрашивает свою маму посидеть с внуками утром в воскресенье. Такой хаос в жизни оказывает на детей глубокое воздействие. Согласно данным исследования, проведенного Институтом экономической политики, маленькие дети и подростки у родителей, которые работают по непредсказуемому расписанию или за пределами стандартного дневного рабочего времени, с большей вероятностью отличаются сниженным интеллектом и проблемным поведением.

Родители могут винить себя в том, что их дети плохо ведут себя в школе или получают плохие оценки, но во многих случаях истинный виновник ситуации – бедность, заставляющая людей хвататься за работу с непредсказуемым расписанием, которое составляют математические модели, делающие жизнь бедных семей еще более невыносимой.

Корень проблемы, как и со многими другими видами ОМП, в том, какая именно цель выбрана составителями модели. Модель оптимизируется под эффективность и максимальную прибыль, а не под справедливость или «благо команды». Это, конечно же, сущность капитализма. Для компаний доходы – как воздух. Деньги поддерживают в них жизнь. Для капиталистов было бы невероятно глупо, даже неестественно отворачиваться от возможной прибыли. Именно поэтому общество нуждается в противодействующих силах, таких как постоянное освещение в прессе, проливающее свет на злоупотребления эффективности и призывающее компании к справедливости. А если компании буксуют на этом пути, как случилось со Starbucks, нужно высвечивать их злоупотребления снова и снова. Также ситуация нуждается во внешнем регулировании, которое бы удерживало компании от злоупотреблений, в сильных профсоюзах, которые организовывали бы работников и выражали их нужды и жалобы. И в политиках, готовых принимать законы, ограничивающие самые тяжелые злоупотребления. После публикации статьи в New York Times в 2014 году демократы в Конгрессе оперативно подготовили законопроект, ограничивающий применение программ, составляющих рабочие расписания. Но с республиканским большинством, которое яростно противится усилению государственного вмешательства в экономику, шансы на принятие этого закона были равны нулю. Инициатива заглохла.

* * *

В 2008 году, перед началом экономического кризиса, компания Cataphora из Сан-Франциско вывела на рынок систему ПО, ранжировавшую работников сферы высоких технологий по ряду параметров, в том числе по их способности генерировать идеи. Это было непросто. В конце концов, компьютерным программам сложно отличить интересную идею от любого другого набора слов. Если вдуматься, разница зачастую – только вопрос контекста. Вчерашние идеи – о том, что Земля круглая, или даже о том, что людям может понравиться рассматривать фотографии друг друга в социальных сетях, – это сегодняшние факты. Мы, люди, все чувствуем, когда идея становится установленным фактом, и знаем, когда она была разоблачена или отброшена, хоть и можем зачастую не соглашаться с этим. Однако это отличие ставит в тупик даже самый продвинутый ИИ. Поэтому системе Cataphora пришлось обратиться за подсказками к самим человеческим существам.

Cataphora забралась в корпоративную почту и мессенджеры в поисках идей. За основную гипотезу при этом принималось, что лучшие идеи имеют тенденцию распространяться более широко через сетевое общение. Если люди копируют и вставляют в свои сообщения определенные группы слов и делятся ими, эти слова, скорее всего, окажутся идеями – и программное обеспечение сможет их учитывать.

Но не все было так просто. Идеи – не единственные группы слов, широко распространяемые по социальным сетям. Мемы, например, пользовались бешеной популярностью и озадачивали компьютер. Также с огромной скоростью распространялись и слухи. Однако шутки и слухи следовали определенным паттернам, поэтому выяснилось, что можно научить программу отфильтровывать их, по крайней мере частично. Со временем система начала идентифицировать группы слов, которые, скорее всего, представляли собой идеи. Она отслеживала их через социальные сети, подсчитывая количество копирований, оценивая их распространенность и идентифицируя их источник.

Очень скоро образы наемных работников, казалось, приобрели четкие очертания. Некоторые из них были генераторами идей, как заключила система. На своей схеме работников Cataphora пометила таких генераторов идей кружками, которые были тем больше и тем темнее, чем больше идей генерировал сотрудник. Другие работники были проводниками – словно нейроны в распределенной сети, они переносили информацию. Самые эффективные проводники разносили определенные фразы по всей сети. Система также обозначила этих людей темным цветом.

Независимо от того, насколько эффективно Cata-phora измеряла потоки идей, сама концепция не была безнравственной. Вполне разумно воспользоваться подобным анализом, чтобы идентифицировать знания людей и соединять их с самими многообещающими коллегами и соавторами. IBM и Microsoft используют корпоративные программы именно для этих целей. Эта система очень похожа на алгоритм сайтов знакомств (и зачастую, без сомнения, она выдает столь же посредственные результаты). Большие данные также использовались для изучения продуктивности работников кол-центров.

Несколько лет назад исследователи из MIT проанализировали поведение работников колл-центра Банка Америки и выяснили, почему одни команды оказывались продуктивнее других. Они повесили так называемый социометрический бейдж на шею каждого сотрудника. Электроника в этих бейджах отслеживала место нахождения сотрудника и измеряла через каждые 16 миллисекунд тон их голоса и жесты. Она записывала, когда люди смотрели друг на друга, сколько времени каждый человек говорил, слушал и перебивал других. Четыре команды сотрудников колл-центра – всего 80 человек – носили эти бейджи в течение шести недель.

Работа этих сотрудников была крайне регламентированна. Разговоры друг с другом не поощрялись, потому что работники должны были проводить как можно больше времени на телефоне, решая проблемы клиентов. На перерыв работники могли уходить лишь по одному.

Исследователи, к своему удивлению, обнаружили, что самая быстрая и эффективная команда колл-центра оказалась и самой социальной. Эти сотрудники пренебрегали правилами и общались друг с другом больше остальных. И, когда всем сотрудникам предложили больше общаться, продуктивность колл-центра резко увеличилась.

Однако исследования, которые отслеживают поведение сотрудников, также могут быть использованы для их отбраковки. Когда экономику поразила рецессия 2008 года, сотрудники отделов кадров в техническом секторе взглянули на схемы Cataphora под другим углом. Они заметили, что, в то время как одни сотрудники были помечены большими темными кругами, круги других были меньше и светлее. Если предстояло сокращать сотрудников (а большинство компаний именно так и поступило), то было бы логично начинать как раз с тех кругов, что поменьше.

Были ли эти сотрудники действительно слабым звеном? Мы снова приходим к цифровой френологии. Если система «назначает» сотрудника «плохим генератором идей» или «слабым проводником», это становится ее собственной правдой – и ее результатом.

Возможно, кто-то сможет предоставить доказательства обратного. Работница, обозначенная бледным кружочком, может генерировать потрясающие идеи, но не делится ими в сети. Или, возможно, она раздает бесценные советы за обедом или умеет разрядить напряжение в офисе удачной шуткой. Возможно, все ее любят, и это само по себе – большая ценность с точки зрения рабочей атмосферы. Но компьютерные системы затрудняются найти цифровые оценки для подобных тонких талантов. Релевантная информация просто не собирается – и в любом случае ее сложно наделить определенной ценностью. Такие таланты обычно не попадают в компьютерную модель.

Таким образом, система находит якобы неудачников. И большое их число потеряло работу в ходе экономического кризиса. Это само по себе несправедливо. Но, что еще хуже, системы вроде Cataphora получают совсем мало ответных данных. Кто-то, определенный как неудачник и затем уволенный, возможно, позже нашел другую работу и получил целую кучу патентов на оригинальные идеи. Но такие данные обычно не собираются. Система понятия не имеет, что совершенно неверно оценила человека – или даже тысячу человек.

В этом заключается трудность, потому что ученым обязательно нужна обратная связь, сообщающая об их ошибках – в данном случае о наличии ложноотрицательных результатов, – чтобы провести ретроспективный анализ и определить, что же пошло не так, что было неверно интерпретировано, какая информация не была учтена. Только так система способна учиться и становиться умнее. Однако, как мы видим, масса ОМП, от моделей рецидивизма до оценки результативности учителей, с легкостью создает свои собственные реальности. Менеджеры делают допущения, что результаты достаточно правдивы, чтобы принимать их во внимание, а алгоритмы позволяют им принимать сложные решения на основе этих результатов. Компании могут увольнять сотрудников и сокращать расходы, перенося вину за свои решения на объективные цифры – и неважно, насколько они в результате точны.

Cataphora так и не смогла по-настоящему утвердиться на рынке, и к тому же ее алгоритм оценки сотрудников был побочным продуктом – гораздо больше внимания разработчики уделяли распознаванию паттернов мошенничества или торговли инсайдерской информацией в компаниях. Компания вышла из бизнеса в 2012 году, а ее программное обеспечение купил стартап Chenope. Тем не менее системы вроде Cataphora потенциально могут стать настоящим оружием математического поражения. Они могут неправильно интерпретировать людей – и наказывать их, – не приводя никаких доказательств того, что эта оценка хоть как-то коррелирует с подлинным качеством работы этих сотрудников.

ПО такого типа сигнализируют о том, что ОМП поднимает голову в новой области. В течение нескольких десятилетий казалось, что только работники промышленности и сферы услуг рискуют быть подвергнуты моделированию и оптимизации. Работники же интеллектуального труда, от юристов до инженеров-химиков, могли избежать воздействия ОМП – по крайней мере на работе. Cataphora оказалась первым сигналом того, что это может измениться. И в самом деле, сейчас во всей индустрии высоких технологий компании пытаются оптимизировать своих «белых воротничков», отслеживая паттерны их общения. Гиганты высоких технологий, такие как Google, Facebook, Amazon, IBM и многие другие, находятся в процессе активного поиска.

На данный момент по крайней мере приветствуется разнообразие, поэтому есть надежда, что работники, отвергнутые одной моделью, могут быть оценены по достоинству другой. Но в конце концов появится единый стандарт индустрии – и тогда мы все окажемся в беде.

* * *

В 1983 году администрацию президента Рейгана встревожило состояние американских школ. В отчете под названием «Нация под угрозой» президентская комиссия предупреждала о «захлестывающей нас волне посредственностей», которая угрожала будущему Америки. В отчете говорилось, что если бы какая-нибудь «недружественная иностранная сила» попыталась навязать Америке такие плохие школы, то, без сомнения, это можно было бы «рассматривать как военные действия».

Самым заметным сигналом кризиса стало видимое снижение результатов SAT. В период между 1963 и 1980 годами баллы за языковые тесты снизились на 50 пунктов, а за математические – на 40. Наша способность конкурировать в мировой экономике базировалась на наших умениях, а они, казалось, ухудшались.

Кого же следовало винить в таком положении вещей? В отчете об этом говорилось однозначно: учителей. Отчет «Нация под угрозой» требовал действий, а именно – тестирования учеников – и использования результатов этих тестов, чтобы выявить недостаточно хороших преподавателей. Как мы уже видели в начале книги, эта практика может стоит учителям их работы. Сара Высоцки, учительница из Вашингтона, уволенная из-за того, что ее класс продемонстрировал на удивление низкие результаты, стала жертвой такого теста. Я использовала эту историю, чтобы показать ОМП в действии – каким оно может быть самовольным, несправедливым и глухим к попыткам обжалования.

Но учителя – это не только люди, которые дают детям образование и заботятся о них. Очевидно, что это еще и работники – и вот здесь я хочу слегка углубиться в модели, оценивающие их работу, потому что они могут распространиться и на другие области, в которых задействована рабочая сила.

Рассмотрим случай Тима Клиффорда. Он – учитель средней школы в Нью-Йорке, преподает английский уже 26 лет. Несколько лет назад Клиффорд узнал, что провалил текст на оценку учителей – в так называемой модели подсчета увеличения коэффициента знаний учеников, сходной с той, которая привела к увольнению Сары Высоцки. Его результат был чудовищным: 6 из 100.

Тим был в отчаянии. «Я не понимал, как это возможно: я так усердно работал все эти годы – и получил такой ужасный результат, – сказал он мне. – Честно говоря, когда я впервые узнал о столь низком результате, я почувствовал стыд и пару дней никому ничего не говорил. Однако я узнал, что в нашей школе два учителя получили еще более низкий результат. Это придало мне смелости признаться в своем: я не хотел, чтобы эти учителя думали, что они такие единственные».

Если бы Клиффорд не занимал постоянную должность в учительском штате, его, как он считает, могли уволить. «Даже с постоянным местом, – сказал он, – низкие результаты тестирования определенно рисуют мишень на спине учителя». Даже с постоянной должностью, с которой невозможно уволить, низкие оценки за тестирование могли бы придать энергии реформаторам, обвиняющим школьную систему в защите некомпетентных преподавателей. Клиффорд начинал следующий учебный год с большими опасениями.

Модель подсчета роста знаний учеников крайне низко его оценила, но не дала никаких советов по улучшению результатов. Поэтому Клиффорд продолжил преподавать так, как всегда делал, с надеждой на лучшее. На следующий год его результат был 96. «Можно было предположить, что я буду в восторге, но это не так, – сказал он. – Я знал, что мой низкий балл – фальшивка, так почему я должен был радоваться высокому баллу, полученному в результате применения той же бракованной формулы? Разница в 90 % в моих результатах только заставила меня убедиться в том, насколько смехотворна модель подсчета увеличения коэффициента знаний, когда речь заходит об образовании».

Фальшивка – удачное слово. На самом деле неверно интерпретированная статистика проходит красной строкой через всю историю оценок учителей. Проблема началась еще с грандиозного статистического ляпа в том самом отчете «Нация под угрозой». Выяснилось, что те самые исследователи, что кричали о национальной катастрофе, основывали свои выводы на фундаментальной ошибке, которая должна быть очевидной даже для студента. На самом деле, если они хотели проиллюстрировать пример образовательных недостатков в Америке, их собственная неспособность правильно интерпретировать статистику могла бы послужить отличным примером.

Через семь лет после сопровождавшейся таким шумом публикации «Нации под угрозой» исследователи из Сандийских национальных лабораторий еще раз взглянули на данные, собранные для отчета. Эти люди не были новичками в области статистики – они занимались созданием компонентов ядерного оружия, – и они быстро нашли ошибку. Да, результаты SAT действительно снизились. Однако число студентов, которые сдавали этот экзамен, резко подскочило за эти 17 лет. Университеты открыли свои двери более бедным студентам и представителям меньшинств. Возможности для таких людей стали шире, и это говорило о социальном успехе. Но, разумеется, такой приток новичков снизил средний балл. Однако когда специалисты по статистике разбили население по группам дохода, результаты для каждой группы, как оказалось, выросли везде, от бедных до богатых.

В статистике этот феномен известен как парадокс Симпсона: когда данные в целом демонстрируют одну тенденцию, однако при разбитии на подгруппы в каждой из этих подгрупп проявляется противоположная тенденция. Неутешительный вывод отчета «Нация под угрозой», который запустил целое движение оценивания учителей, был основан на неправильной интерпретации данных.

Разброс в результатах Тима Клиффорда произошел в результате еще одного случая неверной интерпретации статистики, на этот раз повсеместно распространенной. Баллы учителя берутся из тестов, которые ничего не измеряют. Это может показаться гиперболой. В конце концов, дети ведь сдают тесты, от результатов которых зависит результат Клиффорда. Это действительно так. Но результаты Клиффорда, как унизительные 6 баллов, так и триумфальные 96, были основаны почти полностью на приближениях, причем столь слабых, что по сути своей случайных.

Проблема заключалась в том, что администраторы в своем стремлении к справедливости утратили точность. Они поняли, что было бы неправильно слишком сильно возносить учителей, которые преподают в богатых школах детям врачей и юристов, идущим прямой дорогой в элитные университеты. Равно как и несправедливо ждать от учителей в бедных районах, что они будут добиваться тех же результатов. Мы не можем ждать от них, что они станут творить чудеса.

Поэтому вместо того, чтобы оценивать учителей по абсолютной шкале, они попытались адаптировать свою модель под социальное неравенство. Вместо того чтобы сравнивать учеников Тома Клиффорда с учениками из других районов, они сравнивали их с прогнозируемыми моделями их самих. Каждому ученику присваивался определенный предсказанный результат. Если он превосходил это предсказание, учитель получал хороший балл. Если ученик недотягивал, учителю вменяли это в вину. Вам это кажется примитивным? Поверьте, так оно и есть.

Говоря статистически, в этих попытках освободить тесты от влияния дохода и расовой принадлежности администрация перешла от первичной ко вторичной модели. Вместо того чтобы основывать результаты на прямом оценивании учеников, они основывали их на так называемой величине погрешности, то есть на разрыве между результатами и ожиданиями. С точки зрения математики это гораздо менее точное предположение. Учитывая то, что сами ожидания происходят от статистических данных, это приводит к догадкам поверх догадок. Результатом становится модель со случайными результатами – то, что специалисты по статистике называют «шумом». Вы можете подумать, что большие числа могут дать более надежные результаты. В конце концов, в Нью-Йорке живет 1,1 миллиона учеников общественных школ, и это достаточно большие данные, чтобы делать осмысленные предположения. Если 80 тысяч восьмиклассников сдают тест – наверное, на основе этого количества вполне можно установить достоверные средние баллы для слабых, средних и успешных школ?

Да. И если бы Тим Клиффорд учил большое количество учеников – скажем, десять тысяч, – тогда было бы разумно сравнивать их результаты со средними показателями прошлого года и делать из этого какие-то выводы. Большие числа нейтрализуют исключения – и, теоретически, высвечивают тенденции. Но класс, состоящий из 25 или 30 человек, практически невозможно сравнить с большим количеством. Поэтому, если в классе есть определенный тип учеников, они будут улучшать показатели быстрее среднего уровня. Другие будут это делать медленнее. Клиффорду не дали практически никакой информации по непрозрачному ОМП, которое выдало ему такой дикий разброс в результатах, но он предположил, что дело было именно в этой вариации в его классах. В год, когда Клиффорд получил плохой результат, он, по собственным воспоминаниям, «обучал многих учеников по программе коррекции, как и многих лучших учеников. Думаю, обучение как особых, так и лучших учеников – или и тех и других – создает проблемы. Результаты особых учеников сложно изменить, потому что они испытывают трудности в учебе, тогда как результаты лучших учеников тоже сложно изменить, потому что они уже практически достигли максимума – и у них остается очень мало места для улучшения».

На следующий год ему достался другой набор учеников, в котором большее количество находилось примерно посередине между полюсами. В результате сложилось впечатление, что за год Клиффорд прогрессировал от бездарного до блистательного педагога. И такой результат не редкость. В результате анализа, проведенного блогером и преподавателем Гэри Рубинштейном, каждый из четырех учителей, преподающих один и тот же предмет, получил разброс в 40 баллов по результатам оценивания в течение двух лет подряд. Это заставляет предположить, что оценивание выдавало практически случайные данные. То есть не педагогические способности скачут туда-сюда, а результаты, которые выдает бракованное ОМП.

И хотя эти результаты лишены смысла, модели подсчета роста знаний влияют на систему образования чрезвычайно обширно и пагубно. «Я видел, как некоторые великолепные учителя, основываясь на этих результатах, убеждали себя в том, что они в лучшем случае посредственности, – говорит Клиффорд. – Эти данные сдвинули фокус их внимания с великолепных уроков, которые они раньше давали, на усиленную подготовку к тестам. Для молодого учителя плохой результат – это наказание, а хороший может привести к фальшивому и незаслуженному ощущению, что они чего-то добились».

Как и в случае со многими другими видами ОМП, модели подсчета роста знаний были созданы из самых благих побуждений. Администрация президента Обамы довольно рано осознала, что школьные округа, страдающие от реформы 2001 года («Ни одного отстающего ребенка»), которые ввели стандартизированные тесты высокой важности, как правило, оставались бедными и лишенными привилегий. Поэтому администрация предложила для этих округов отступления от правил: те могли продемонстрировать эффективность своих учителей, и школы не наказывались, даже если их ученики выдавали далеко не лучшие результаты.

Использование подсчета увеличения коэффициента знаний во многом используется из-за этого административного изменения. Но в конце 2015 года лихорадка тестирования учителей вступила в, возможно, еще более драматическую фазу. Во-первых, Конгресс и Белый дом согласились отменить программу «Ни одного отстающего ребенка» и заменить ее законом, который дает штатам больше свободы действий в развитии собственных подходов к улучшению слабых школьных округов. Также он дает им больший набор критериев для рассмотрения, включая взаимоотношения учителей и учеников, доступ к продвинутому обучению, школьный климат и безопасность. Иными словами, власти в области образования могут попытаться разобраться, что происходит в каждой конкретной школе, – и обращать меньше внимания на ОМП, включая модели подсчета увеличения коэффициента знаний. Или, еще лучше, полностью их отбросить.

Примерно в это же время рабочая группа по вопросам образования при губернаторе штата Нью-Йорк Эндрю Куомо инициировала четырехлетний мораторий на тесты по оцениванию учителей. Это изменение, хоть и благое, не говорит о том, что ОМП, оценивающее учителей, в принципе решено отвергнуть – не говоря уже о том, чтобы счесть его несправедливым. Импульс на самом деле поступил от родителей, которые пожаловались на то, что режим подготовки к тестам изматывает их детей и занимает слишком много времени в учебном году. В результате движения бойкота 20 % школьников с третьего по восьмой классы не приняли участия в тестах весной 2015 года – и это число продолжало расти. Чтобы угодить родителям, администрация Куомо нанесла удар по модели подсчета увеличения коэффициента знаний. В конце концов, без тестирования всех учеников у штата не было бы данных, чтобы заполнить эти модели.

Тима Клиффорда обрадовали эти новости, но он не расслабляется. «Бойкот вынудил Куомо принять эти меры, – считает он. – Губернатор побоялся потерять поддержку более богатых избирателей в лучших школьных округах – тех самых людей, которые вернее всего его поддерживали. Чтобы выбраться из этой ситуации, он объявил мораторий на использование результатов тестов». Клиффорд опасается, что тесты вернутся.

Возможно, так оно и будет. А учитывая, что модели подсчета увеличения коэффициента знаний стали проверенным оружием в борьбе с профсоюзами учителей, я не думаю, что они в ближайшее время исчезнут. Они уже глубоко укоренились: 40 штатов и округ Колумбия их используют в той или иной форме. Тем важнее привлекать внимание к этим и другим видам ОМП. Как только люди начнут опознавать эти модели как оружие и понимать их статистические ошибки, они потребуют введения новой системы оценивания, которая будет более справедливой как для учителей, так и для учащихся. Однако если цель тестирования – найти козлов отпущения и запугать работников, то, как мы уже видели, ОМП, генерирующие наиболее бессмысленные результаты, достигают этой цели вернее всего.

Назад: К службе негоден: в поисках работы
Дальше: Небоевые потери: кредитная политика