Логика больших чисел
Много говорят о том, что статьи в Википедии «не заслуживают доверия», то есть они не всегда точны. Конечно, это неизбежно, если писать может каждый. В отличие от Britannica, где каждая статья редактируется, перепроверяется и шлифуется ответственными профессионалами, статьи в Википедии возникают из небытия при помощи кнопки «отредактировать».
В конце 2005 года Джон Сейгенталер (John Seigenthaler, Sr.) написал в журнале USA Today о статье в Википедии, посвященной ему самому. Статья начиналась так:
Джон Сейгенталер был ассистентом генерального прокурора Роберта Кеннеди в начале 60-х годов. Некоторое время считалось, что он замешан в убийствах Кеннеди, как Джона, так и его брата, Бобби. Это не было доказано.
За исключением того, что он был ассистентом Роберта Кеннеди в 60-х годах, все остальное было бесстыдной ложью. Сейгенталер позвонил Уэльсу и заставил его удалить статью (хотя с легкостью мог сделать это сам). После этого он написал о случившемся, что инициировало до сих пор не прекращающуюся дискуссию о том, насколько можно доверять Википедии.
На этот вопрос нет однозначного ответа, потому что сама природа созданного пользователями контента такова, что на микроуровне он неаккуратен (а на этом уровне мы обычно с ним и сталкиваемся), в то время как на макроуровне он удивительно точен. Надо просто понимать его природу.
Википедия, Google и совокупное знание миллионов, пишущих в блоги, управляется чуждой логикой вероятностной статистики — вероятностью, а не уверенностью. Мы хотим знать, ошибочна статья в энциклопедии или нет. Мы хотим быть уверены, что чья-то мудрая рука (желательно человеческая) направляет результаты поиска в Google. Мы хотим верить тому, что читаем.
Когда делом занимаются профессионалы — редакторы, ученые, журналисты — мы, по крайней мере, знаем, что кто-то следит за точностью сведений. Однако сейчас мы все больше зависим от системы, где нет «главного»; знания просто «возникают», то есть появляются спонтанно по закону больших чисел. Вероятностные системы не совершенны, однако статистически они хорошо справляются со своей задачей на больших промежутках времени и объемах. Они рассчитаны на «масштаб» и улучшаются с его увеличением. Небольшая погрешность на микроуровне — это цена эффективности на макроуровне.
Но как такая, кажущаяся неправильной, вещь может работать?
Вот камень преткновения… Людям сложно понять логику системы. Именно поэтому мы до сих пор спорим о Дарвине. Мы помним о великом шотландце Адаме Смите и о его «невидимой руке», и Джеймс Суровецки написал о нем прекрасную книгу «Мудрость толп» (The Wisdom of the Crowds), рассказывающую о том, как многие могут быть умнее нескольких. Рыночная экономика и эволюция — вероятностные системы, которые кажутся нелепыми мозгу млекопитающих. То, что несколько умных людей додумались до этого и на таком основании построили современную экономику — от рынка ценных бумаг до Google — только доказывает, что наше коллективное «программное обеспечение» (коллективные знания) развиваются быстрее, чем «железо» (мозг).
Вероятностные системы, если использовать выражение писателя Кевина Келли (Kevin Kelly), «не поддаются контролю». Его книга рассматривает пример за примером, от демократии до собирания птиц в стаи, где порядок возникает из того, что кажется хаосом, и как будто бы обращает энтропию вспять. Его книге более десяти лет, однако и десятилетия спустя его мысли будут казаться удивительными, но верными.
Достойна ли доверия Википедия? Нет. А что достойно? Britannica контролируется небольшим числом людей, у которых в среднем лучше образование. Конечно, в ней меньше (если они там вообще есть) ошибок и подлогов, чем в Википедии. Однако она не безошибочна. Исследование, проведенное в 2005 году научным журналом Nature, показало, что в 42 научных областях на статью в Википедии приходится четыре ошибки, а в Britannica — три. Вскоре после публикации исследования ошибки в Википедии были исправлены, a Britannica ожидает следующего переиздания.
Чаще всего Britannica не затрагивает некоторые темы. Ее статьи в некоторых областях недостаточно глубоки, другие устарели. Существуют миллионы статей, которых в ней просто нет и не может быть, учитывая сам процесс ее составления. А Википедия может включать в себя все и многое другое. Кроме того, она постоянно обновляется.
Преимущество вероятностных систем в том, что они используют совокупные знания толпы и могут одинаково успешно расти вширь и в глубину. Однако на микроуровне к их результатам следует относиться с некоторым скептицизмом. Википедия должна быть первым из источников информации, а не последним. Она должна быть точкой начала исследования, а не собранием непреложных фактов.
То же верно и в отношении блогов, ни один из которых не заслуживает полного доверия. Блоги — «длинный хвост», а делать обобщения о качестве контента в «длинном хвосте» нельзя, потому что он по определению изменчив и разнообразен. Однако в совокупности блоги более чем сопоставимы с обычными СМИ. Перед тем как принять решение, нужно просто прочесть несколько блогов.
То же и Google, который кажется всезнающим и никогда не ошибающимся. Он видит взаимосвязь там, где я или вы можете ее не заметить, потому что работает в масштабе, который мы не можем осознать. Возможно, Google — первая компания, генетически завязанная на чуждую логику больших чисел Сети. Поэтому он настолько успешен и кажется непобедим.
Писатель Пол Грэхем (Paul Graham) говорит:
У Сети есть собственная структура, и Google ей соответствует. Кажется, что они ничего не делают для достижения успеха. Они плывут по ветру, вместо того, чтобы молиться о даровании очередной бизнес-модели, как печатные СМИ, или судиться с собственными потребителями, как Microsoft и звукозаписывающие компании. Google не старается изменить положение вещей, а старается понять, что происходит, чтобы оказаться в самом центре.
Сеть — всеобъемлющий рынок идей, управляемый законами больших чисел. Структура, которую видит Грэхем, — это сеть статистических волн, единственная логика, которую понимают большие системы. Возможно, наступит день, когда и мы сможем ее понять.