Не будет преувеличением сказать, что теорема Байеса относится к наиболее важным открытиям в истории науки. Статистиков, ученых и специалистов по машинному обучению она приводит чуть ли не в религиозный экстаз. Хотя, в сущности, она предельно проста. Проста настолько, что поначалу кажется констатацией очевидного факта.
Позвольте мне объяснить вам суть идеи на самом тривиальном примере.
Представьте себе, что вы ужинаете в ресторане. И вот ваш визави, придвинувшись к вам поближе, шепотом сообщает, что видит за соседним столиком саму Леди Гагу.
Прежде чем обернуться, вы наверняка быстренько прикинете про себя, стоит ли верить этой информации. Примете во внимание известные вам объективные факторы – такие как класс заведения, расстояние до Малибу, где живет Леди Гага, острота зрения вашего друга (подруги). В таком духе. При необходимости вы могли бы дать количественную оценку этому предположению. Как бы рассчитать вероятность события.
Когда вы наконец повернете голову и посмотрите на ту даму, то рефлекторно зафиксируете факты, необходимые для проверки предложенной гипотезы. Возможно, вы как раз и ожидали лицезреть платиновую блондинку – тогда вы укрепитесь во мнении, что рядом с вами действительно Леди Гага. Но она одна, без охраны – и вы засомневаетесь. То есть каждый новый результат наблюдения влияет на совокупную оценку – события.
В этом и есть смысл теоремы Байеса – она позволяет систематически корректировать веру в гипотезу на основании имеющихся доказательств. Согласно теореме, нельзя составить однозначное мнение о рассматриваемой теории, но, исходя из доступной информации, можно высказать наиболее близкие к истине предположения. Поэтому, как только вы осознаете, что на даме за столиком напротив мясное платье – наряд, который вы едва ли увидите на ком-нибудь, кроме Леди Гаги, – скорее всего, сила вашей убежденности зашкалит, и вы окончательно решите, что в ресторане действительно сидит Леди Гага.
Однако теорема Байеса не только облекает в математическую формулу манеру людей принимать решения. Она имеет гораздо более глубокий смысл. Процитирую Шэрон Берч Макгрейн, автора книги “Теория, которая вряд ли умрет”: “Байес выступает против прочно укоренившегося в сознании людей убеждения, что современная наука требует объективности и точности”. Байес предложил методику измерения веры во что-либо и тем самым показал, как из беглых наблюдений, разрозненных, неполных и приблизительных данных и даже из отсутствия информации вывести обоснованные умозаключения.
Байес нужен не только для того, чтобы подтвердить наши интуитивные догадки. Оказывается, если вас попросят дать количественную оценку своей уверенности в чем-либо, вы можете прийти к контринтуитивным, то есть, на первый взгляд, противоречащим здравому смыслу выводам. Пример из главы “Правосудие” (с. 100), где потенциальными убийцами незаслуженно оказались преимущественно мужчины, объясняется теоремой Байеса. И то, что процент ошибок в анализах на рак груди говорит о возможном отсутствии онкологии, даже если такой диагноз поставлен (глава “Медицина”, с. 121), тоже объясняется теоремой Байеса. В любой области науки теорема Байеса помогает нам более четко понять суть того, что мы вообще-то знаем.
Но если вы хотите рассмотреть несколько гипотез одновременно – скажем, если надо понять по комплексу симптомов, что случилось с пациентом, или определить местонахождение робомобиля по показаниям приборов, – метод Байеса считается методом выбора. По идее, любой диагноз и любая точка на карте могут оказаться верными. От вас требуется только сопоставить доказательства и выбрать решение, которое представляется вам наиболее точным.
В этом смысле задача локализации автомобиля без водителя очень напоминает ту, над которой бился Томас Байес, пресвитерианский священник и талантливый математик, чьим именем названа известная теорема. В середине XVIII века он придумал игру для иллюстрации к своей задаче и описал ее правила в эссе. Я расскажу вам, что это была за игра.
Вы сидите спиной к квадратному столу. Я бросаю на стол красный шарик, так чтобы вы его не видели. Вы должны угадать, где он остановился. Это непросто: без исходной информации вы не можете даже предположить, где он мог бы быть.
Поэтому я вам помогаю – бросаю на тот же стол второй шарик другого цвета. Ваша задача та же – определить, где находится первый, красный, шарик, но на этот раз я подскажу вам, как расположен второй шарик относительно первого, то есть перед красным, сзади него, левее или правее. И вы можете скорректировать свои предположения.
Повторяем тот же ход. Я бросаю третий шарик, четвертый, пятый и каждый раз говорю вам, где они остановились относительно первого, красного, шарика – положение которого вы пытаетесь угадать.
Чем больше шариков я брошу и чем больше информации вам сообщу, тем отчетливее вы должны видеть мысленным взором красный шарик на столе. Вы не можете точно знать, где он находится, но будете уточнять свои предположения до тех пор, пока не сможете дать уверенный ответ.
В каком-то смысле автомобиль-беспилотник с его точными координатами ничем не отличается от нашего красного шарика. Вместо повернувшегося спиной к столу человека – алгоритм, который пытается угадать, где в данный момент находится автомобиль, а вместо вспомогательных шариков – источники данных, то есть GPS, инерциальные датчики и так далее. Ни один из этих источников не даст алгоритму исчерпывающей информации о положении машины, но каждый внесет свою лепту, чтобы алгоритм уточнил предполагаемый ответ. Такой метод логического заключения о координатах объекта на основании имеющихся данных – и байесовского подхода – называется вероятностным выводом. В грамотно скомпонованном виде получим еще один алгоритм машинного обучения.
К началу третьего тысячелетия, накопив достаточно опыта работы с крылатыми ракетами, космическими кораблями и самолетами, инженеры уже понимали, с какой стороны взяться за решение задачи локализации. Они по-прежнему не могли ответить робомобилю на вопрос “где я?”, но байесовский подход, по крайней мере, давал надежду.
Благодаря Байесу с 2004 года, когда первые гонки Grand Challenge оставили после себя кладбище роботов, до впечатляющей победы высоких технологий в 2005 году, когда пять разных машин сумели проехать более ста миль без участия людей, произошло множество важнейших качественных скачков. Другие насущные задачи – объяснить машине, что вокруг нее и что ей следует делать, – тоже помогли решить алгоритмы, которые работали по теории Байеса.