Книга: Социальная физика. Как Большие данные помогают следить за нами и отбирают у нас частную жизнь
Назад: Новое соглашение по данным
Дальше: Социальная физика и понятия свободной воли и человеческого достоинства

Дикий, дикий Web

До сих пор я фокусировался на новых, сенсорных источниках персональных данных, поскольку масштабы и характер этих данных неизвестны многим людям. Конечно, огромное количество персональных данных уже собрано в интернете. Большую их часть составляет информация, публикуемая пользователями на сайтах социальных сетей, форумах и в блогах; данные о сделках и регистрациях от интернет-магазинов и организаций; а также истории просмотров и кликов. Исследователи только начинают работу по «добыче реальности» из фото и видео, загружаемых пользователями, которые, хотя владельцы и загружают их сознательно, представляют ту же угрозу неумышленного вреда, что пассивно собираемые сенсорные данные, такие как записи звонков и данных о местоположении телефона.

Всемирная сеть превратилась в беспорядочную среду без каких-либо внятных норм, касающихся конфиденциальности личных данных. Следовательно, права на использование таких данных не ясны и меняются от сайта к сайту. Иначе дело обстоит с информацией о местоположении, показаниями медицинских датчиков и прочими данными, которые собираются строго регулируемыми предприятиями с довольно четкими правилами собственности. Такая информация может стать более доступной, если к существующим системам присоединить новое соглашение по данным. Это даст возможность тщательно контролировать совместное использование личной информации такого типа.

Но что насчет нашего «дикого, дикого» интернета? К счастью, существующие веб-компании уже ощущают на себе давление, побуждающее их соответствовать более высоким стандартам, которых требуют регулиторы. Возможно, лучшим примером является Google, участник инициативы по переосмыслению личных данных на Всемирном экономическом форуме, где я был одним из руководителей. После первого цикла дискуссий форума компания представила сервис Google Dashboard (www.google.com/dashboard), который позволяет пользователям узнать, какими данными о них располагает Google. После второго цикла дискуссий компания сформировала Data Liberation Front («Фронт освобождения данных») (www.dataliberation.org) – группу инженеров Google, в чьем манифесте говорится, что «пользователи должны иметь возможность контролировать данные о себе, собираемые продуктами Google», и цель которой – «облегчить внесение и извлечение данных». Когда мой бывший студент Брэдли Горовиц участвовал в запуске Google+ в июне 2011 года, владение данными и их мобильность стали ключевым элементом проекта. Эти шаги, сделанные навстречу индивидуальному контролю над персональными данными, – лишь начало, но давление, призывающее компании официально и полностью принять новое соглашение по данным, возрастает.

Информационно-управляемые системы: задачи

Возможность безопасно делиться данными неизбежно приведет к появлению методов и принципов управления, которые будут больше опираться на данные. Мы можем надеяться, что при помощи больших данных и социально-физического анализа нам удастся достичь улучшений в социальной сфере. И, что, может быть, не менее важно, социальная физика позволяет нам, используя большие данные и визуальные модели, наблюдать уже почти что в реальном времени за работой наших методов, и эта повышенная прозрачность может дать людям реальный, сознательный контроль над тем, как и когда эти методы должны пересматриваться и корректироваться.

Например, сейчас моя лаборатория занимается разработкой гибридного веб-сайта с картами на основе Google maps, только вместо дорог и изображений, полученных со спутников, он отображает карты уровней бедности, младенческой смертности, преступности, изменения ВВП и другие социальные показатели, которые ежедневно обновляются для каждой местности. Благодаря этой новой возможности картографирования можно быстро увидеть, где новые государственные инициативы работают, а где нет.

Главным препятствием на пути к созданию более совершенных социальных систем при помощи таких массивных данных, однако, не является ни их размер или скорость, ни даже проблемы приватности и отчетности обмена. Самая большая задача – научиться строить социальные институты на основе анализа миллиардов индивидуальных связей. Мы должны перейти от систем, основанных на средних показателях и стереотипах, к тем, что основаны на анализе индивидуальных взаимодействий.



Выход за рамки закрытых лабораторий: Наши традиционные методы тестирования и улучшения органов власти, организаций и т. д. – мало могут помочь нам в создании информационно-управляемого общества. Даже научный метод в обычном его применении больше не работает, поскольку потенциальных соединений так много, что наши стандартные статистические инструменты дают бессмысленные результаты.

Причина в том, что такие насыщенные данные позволяют обнаружить корреляции, которые иначе могли быть пропущены или неправильно интерпретированы. Представим, например, что мы выяснили следующее: у чрезмерно активных людей больше шансов заболеть гриппом, чем у остальных. Это пример из реальной жизни: поминутно отслеживая поведение небольшого университетского сообщества – это целые гигабайты данных, собираемые в режиме реального времени ежесуточно в течение года, – мы заметили, что необычно высокий уровень активности часто предшествовал началу болезни. Но если мы будем анализировать данные только с помощью традиционных статистических методов, то у нас возникнет проблема с пониманием того, почему это так. Может, причина в том, что вирус гриппа заставляет нас быть более активными, чтобы распространиться быстрее? Или дело в том, что взаимодействие с большим количеством людей, чем обычно, повышает их шансы на заражение? Или же в чем-то другом? Мы не можем узнать это на основе одного лишь потока данных, поступающих в режиме реальном времени.

Главное здесь то, что обычных аналитических методов недостаточно для того, чтобы дать ответы на эти вопросы, поскольку нам неизвестны все возможные варианты, и в таком случае мы не можем сформулировать ограниченное количество ясных, поддающихся проверке гипотез. Чтобы решить эту проблему, нам необходимо разработать новые способы проверки казуальности связей в реальном мире. Мы больше не можем полагаться на лабораторные эксперименты; мы должны проводить эксперименты непосредственно в реальном мире, основываясь на массивных потоках данных, поступающих в реальном времени.

Проектирование законов и институтов с применением массовых, живых данных выходит за рамки привычного для нас образа действий. Мы живем в эпоху, в основе которой лежат века научного и технического развития, и стандартные варианты улучшения систем, правительственных учреждений, организаций и проч. нам хорошо понятны. Следовательно, в наших научных экспериментах нам, как правило, достаточно рассматривать лишь несколько ясных альтернатив (например, правдоподобные гипотезы).

Но с приходом больших данных нам придется много работать за пределами старой, хорошо знакомой нам территории. Эти данные часто носят косвенный и искаженный характер, и их интерпретирование требует большей тщательности, чем обычно. Еще более важно то, что значительная часть этих данных содержит информацию о поведении людей, и вытекающие из них вопросы связаны с проведением параллелей между физическими условиями и социальными эффектами. Пока у нас нет прочной, хорошо зарекомендовавшей себя количественной теории социальной физики, мы не можем формулировать и тестировать гипотезы так, как мы это делаем при проектировании мостов или разработке новых лекарств.

Следовательно, мы должны продвинуться за рамки того закрытого лабораторного процесса типа «вопрос-ответ», который мы используем сейчас, и начать по-новому взаимодействовать с обществом. Нам необходимо начать тестировать связи в реальном мире намного раньше и намного чаще, чем нам когда-либо доводилось делать раньше, используя методы, разработанные мной и моей исследовательской группой для исследований «Друзья и семья» и «Социальная эволюция». Нам нужно построить живые лаборатории – сообщества, желающие открыть для себя новый образ мыслей или, если говорить прямо, стать лабораторными мышами, – чтобы доказывать и проверять на практике наши идеи. Это целая новая территория, и поэтому для нас важно постоянно тестировать новые идеи в реальном мире, чтобы понимать, какие из них работают, а какие нет.

Примером такой живой лаборатории является «город открытых данных» – проект, который я совсем недавно запустил в городе Тренто в Италии при участии компаний Telecom Italia, Telefónica, научно-исследовательского университета «Фонд Бруно Кесслера», Института информационного проектирования и местных компаний. Важно отметить, что эта живая лаборатория действует с разрешения и осознанного согласия всех ее участников – они знают, что являются частью гигантского эксперимента, цель которого заключается в изобретении более совершенного образа жизни. Подробную информацию об этой живой лаборатории можно найти на сайте http://www.mobileterritoriallab.eu/.

Цель эксперимента – в том, чтобы разработать новые способы обмена данными, направленные на повышение уровня гражданской активности и исследований. Одной из конкретных задач является развитие и тестирование программного обеспечения, построенного по принципу сетей доверия, таких как наша система openPDS. Инструменты, подобные openPDS, позволяют людям безопасно делиться личными данными (например, данными о состоянии здоровья, информацией об их детях) за счет контроля над тем, куда направляются эти данные и какие операции над ними производят.

Специфические исследовательские вопросы, над которыми мы работаем, связаны с набором сервисов персональных данных, разработанных для того, чтобы пользователи могли собирать, хранить, организовывать, раскрывать, публиковать и использовать данные о самих себе. Эти данные могут быть использованы для саморазвития каждого участника или (взятые в совокупности) для улучшения всего сообщества посредством создания общего поля, где могут быть активированы социально-сетевые стимулы. Возможность безопасно делиться данными должна улучшить поток идей между индивидами, компаниями и органами правления, и мы хотим понять, могут ли эти инструменты на самом деле увеличить производительность и творческую продуктивность в масштабе целого города.

Один из способов применения системы доверия openPDS – обмен практическими советами между семьями с маленькими детьми. Как другие семьи тратят свои деньги? Как часто они выбираются куда-то и общаются с другими людьми? Какие дошкольные учреждения или врачи самые надежные? Как только человек дает свое разрешение, наша система openPDS безопасно и автоматически собирает данные и делает их анонимными, чтобы поделиться ими с другими молодыми семьями.

Система openPDS позволяет молодым семьям в сообществе учиться друг у друга без необходимости вводить данные вручную или рисковать, публикуя их в актуальных сейчас социальных сетях. Хотя эксперимент с Тренто все еще находится на ранней стадии, участвующие семьи сразу отметили, что эти средства для обмена данными приносят пользу, и они чувствуют, что могут безбоязненно делиться своими данными с помощью системы openPDS.

Живая лаборатория Тренто позволяет нам искать способы решения тонких вопросов, связанных со сбором и использованием глубоко личных данных в реальных ситуациях. В частности, лаборатория будет использоваться как экспериментальная площадка для нового соглашения по данным и для поиска новых путей обеспечения пользовательского контроля над использованием их персональных данных. Например, мы будем искать различные техники и методики, позволяющие защитить приватность пользователей и в то же время использовать их персональные данные для генерации полезного информационного фонда. Мы также будем изучать различные пользовательские интерфейсы для настроек приватности, конфигурации собранных данных и данных, открытых для приложений и доступных другим пользователям, – и все это в контексте системы доверия.



Испытание для человеческого понимания: Вторая проблема в создании общества, управляемого данными, кроется в человеческом понимании. Теперь, с появлением плотных, непрерывных данных и современных вычислительных технологий, мы можем отмечать мельчайшие детали общественного устройства и строить математические модели на их основе. Но эти грубые математические модели выходят далеко за пределы понимания большинства людей. Они содержат слишком много переменных, и взаимосвязи в них слишком сложны для бедного человеческого разума. В то время как эти высоко детализированные и очень математические модели хороши для построения автоматических систем дорожного движения, электричества и т. п., они почти бесполезны для индивидуального принятия решений.

Для того чтобы органы правительства и остальные граждане могли принимать решения, связанные с устройством нашего общества, мы должны построить доступное человеку интуитивное понимание того, как мельчайшие взаимодействия в пределах этого общества могут способствовать изменениям. Новый язык, который пересечет границы рынков и классов и покажет, как индивидуальные связи между людьми задают направление перемен, поможет нам развить это понимание.

На мой взгляд, необходимо наладить диалог между человеческой интуицией и статистикой больших данных – это то, чего на данный момент не хватает в большинстве существующих систем управления. Сегодня бо́льшая часть людей имеют очень скромное представление о том, как анализировать большие данные, что они означают и каких принципов стоит придерживаться. Я надеюсь, что язык и понятия социальной физики позволят нам заполнить этот пробел.

Назад: Новое соглашение по данным
Дальше: Социальная физика и понятия свободной воли и человеческого достоинства