Проблема избыточной точности
Единственное критическое замечание в адрес Сильвера, которое я в какой-то мере поддерживаю, состоит в том, что утверждения типа «На данный момент шансы Обамы на победу составляют 73,1 %» вводят людей в заблуждение. Десятичное число предполагает такой уровень точности оценок, которого на самом деле нет: вряд ли стоит говорить о том, что произойдет нечто значительное, если модель Сильвера даст значение 73,1 % в один день и 73,0 % на следующий день. Эта критика направлена в адрес подачи информации Сильвером, а не его реальной программы, но она имела большой вес у политических обозревателей, которые считали, что читателям навязывают одобрение того или иного кандидата посредством впечатляюще точных прогнозов.
Существует такая вещь, как избыточная точность. Модели, которые используются для подсчета результатов SAT, позволяют рассчитать средний балл SAT с точностью до нескольких десятичных знаков – если мы решили бы это сделать. Но мы не станем так поступать: ученики и без того волнуются, поэтому не нужно умножать их беспокойство по поводу того, что кто-то из одноклассников опережает их на сотую долю процента.
Преклонение перед абсолютной точностью сказывается и на выборах, причем не только в период лихорадочного отслеживания результатов опросов, но и после их проведения. Если вы помните, в 2000 году выборы в штате Флорида завершились с разницей в несколько сотен голосов между Джорджем Бушем-младшим и Альбертом Гором, что составляло сотую долю процента от общего количества голосов. Согласно нашему законодательству и обычаю было крайне важно определить, кто из кандидатов может претендовать на превосходство в несколько сотен голосов. Однако если нам нужно обсудить тему: кого жители Флориды хотели бы видеть своим президентом, – эти подсчеты не имеют никакого смысла. Возникающая из-за испорченных, потерянных и неправильно подсчитанных избирательных бюллетеней неточность гораздо больше той микроскопической разницы между окончательными результатами голосования. Мы не знаем, кто получит больше голосов во Флориде. Разница между судьями и математиками состоит в том, что судьям приходится постоянно корчить из себя людей знающих, тогда как математики могут говорить правду.
Журналист Чарльз Сейфе включил в свою книгу Proofiness («Доказательность») очень забавный и немного удручающий рассказ об аналогичном случае упорной борьбы между демократом Элом Франкеном и республиканцем Нормом Коулманом за право представлять штат Миннесота в сенате США. Было бы замечательно заявить о том, что Франкен занял пост сенатора благодаря тому, что беспристрастная методика анализа показала, что на 312 больше избирателей Миннесоты хотят видеть его в верхней палате. Однако на самом деле это число представляет собой результат длительной юридической тяжбы по поводу того, можно ли считать поданным бюллетень с отметкой возле фамилии Франкена и надписью «Люди-ящеры». Когда дело доходит до такого, вопрос, кто «на самом деле» получил больше голосов, не имеет смысла. Сигнал потерялся в шуме. Я склонен стать на сторону Сейфе, который утверждает, что выборы с настолько близкими шансами кандидатов на победу можно проводить посредством подбрасывания монеты. Кто-то не примет идею о случайном выборе наших лидеров. Однако в этом и есть самое важное преимущество подбрасывания монеты! Выборы с почти равными шансами на победу и без того зависят от воли случая. Плохая погода в большом городе, взломанная машина для голосования в далеком городке, некорректное оформление избирательного бюллетеня, из-за которого пожилые евреи голосуют за Пэта Бьюкенена, – любое из этих случайных событий может иметь значение, если голоса избирателей разделены примерно 50 на 50. Выбор посредством подбрасывания монеты позволяет не делать вид, будто люди высказались в поддержку кандидата, победившего в упорной борьбе при почти равных шансах. Иногда все, что говорят люди, – это «Я не знаю».
Вы можете подумать, что я действительно испытываю пристрастие к десятичным знакам. У стереотипа, будто математики всегда во всем уверены, есть неразрывно связанный с ним брат-близнец – это стереотип, будто мы всегда стремимся к максимальной точности, упорно пытаясь вычислять все до как можно большего количества десятичных знаков. Но это не так. Мы стремимся вычислять все до необходимого количества десятичных знаков. В Китае есть молодой человек по имени Лу Чао, который выучил и воспроизвел 67 890 цифр числа π. Это впечатляющее достижение в области запоминания. Но любопытно ли это? Нет, потому что сами по себе цифры числа π не представляют никакого интереса. Насколько нам известно, они ничем не лучше случайных цифр. А вот само число π, вне всякого сомнения, представляет большой интерес. Однако число π – это не его цифры; оно просто определяется цифрами, точно так же как Эйфелеву башню определяют координаты 48,8586 градуса северной широты и 2,2942 градуса восточной долготы. Можете прибавить сколько угодно десятичных знаков к этим числам – они все равно не скажут вам, что делает Эйфелеву башню Эйфелевой башней.
Проблема избыточной точности касается не только цифр. Бенджамин Франклин весьма язвительно писал о члене своей филадельфийской группы Томасе Годфри:
За пределами своей специальности он мало что знал; он не был приятным собеседником в обществе, так как, подобно большинству великих математиков, с которыми я встречался в своей жизни, он требовал во всех случаях чрезвычайной точности выражений и всегда цеплялся к пустякам, что расстраивало всякую беседу.
Это немного задевает за живое, потому что отчасти это несправедливо. Математики могут быть весьма щепетильными в отношении логических деталей. Мы относимся к числу людей, которые считают забавным на вопрос «Что вы хотите, суп или салат?» ответить «Да».