Книга: Кибервойны ХХI века. О чем умолчал Эдвард Сноуден
Назад: Глава 2
Дальше: Глава 4 ПРЕСТУПНОСТЬ ЦИФРОВОГО МИРА

Глава
3 БОЛЬШИЕ
ДАННЫЕ

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

.1. Большие данные
как стратегический ресурс
В последние годы Большие Данные являются общепризнанным трендом экономического и техноло- гического развития. Им посвящены тысячи публикаций. Они относятся к числу наиболее популярных тем, как в специализированных изданиях, так и в различного рода СМИ, рассчитанных на самую широкую аудиторию. В ре- зультате возникло впечатление, что Большие Данные – это нечто само собой разумеющееся, ясное, понятное. Широко распространена иллюзия о повсеместном при- менении Больших Данных в России.
Между тем, дело обстоит совсем не так. Беспри- страстный анализ фактических данных показывает, что наша страна существенно отстает в сфере Больших Дан- ных. Значительная часть компаний только используют термин «Большие Данные» в маркетинговых целях, а по сути, применяют старую, хорошо известную бизнес- аналитику, которая заметно отличается от Больших Дан- ных. В стране практически нет спроса на специалистов по Большим Данным. Достаточно посмотреть наиболее популярные порталы работ, чтобы убедиться, что спрос на специалистов по Большим Данным у нас на порядки меньше, чем в США, Европе, Японии, Китае. В то время как во всем мире издаются сотни профессиональных и общедоступных книг по отдельным аспектам Больших Данных, в России только в этом году вышла первая кни- га по Большим Данным – работа В. Майер-Шенбергера и К. Кукьера «Большие данные. Революция, которая из-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

менит то, как мы живем, работаем и мыслим». Да и эта книга носит не профессиональный характер, а написана в жанре нон-фикшн.
Происходящее вызывает особую тревогу в услови- ях, когда ведущие наднациональные мировые струк- туры и транснациональные корпорации, правитель- ства ведущих стран мира, бизнес самых различных масштабов, системы управления производственной и социальной инфраструктурой и, конечно же, военно- разведывательный комплекс всех основных стран мира уже используют Большие Данные как важнейший стра- тегический ресурс.
Достаточно парадоксально, что до сих пор при ши- роком использовании технологий Больших Данных нет общеупотребительного их определения. Наиболее часто используется популярное определение Майкла Фран- клина из Университета в Беркли: «Большие Данные – это любые данные, работа с которыми требует значительных затрат и из которых трудно извлечь информацию». Дан- ное определение кочует из книги в книгу, из работы в ра- боту. Между тем, оно является лучшим подтверждением тезиса о том, что наука о Больших Данные и практиче- ские технологии Больших Данных живут в параллельных реальностях. Соответственно, наука о Больших Данных не столько выступает надежным базисом для инжене- рии данных, сколько намерено или ненамеренно скры- вает революционную суть технологий Больших Данных. В самом деле, определение через большие затра-
ты и трудность обработки может указывать не только на специфические характеристики данных, но и на не- эффективность применяемых технологий. По сути, это определение ничего не говорит о том, чем Большие Дан- ные отличаются от просто данных. Казалось бы, штука эта безобидная и носит исключительно академический характер. Однако, на практике это не так. Когда лица, принимающие решения, возможно и не обладающие

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

глубокими профессиональными познаниями, но в по- давляющем числе наделенные недюжинным здравым смыслом, встречаются с подобными определениями, у них возникает подозрение, что они имеют дело с оче- редной маркетинговой уловкой. Суть этой уловки в том, чтобы просто извлечь из организации деньги, заставив ее заплатить за старые решения под новым названием. Несомненно, что непонятность Больших Данных для лиц, принимающих решения, в том числе и у нас, принципи- альное отличие технологий Больших Данных от того, что было раньше, стали одними из важных причин, почему Россия и целый ряд других стран, располагающих всеми необходимыми предпосылками для использования этих технологий, на сегодняшний день отстают в гонке циф- ровых вооружений.
Чтобы разобраться с тем, что такое Большие Данные и в чем принципиальная новизна их технологий, надо для начала отследить время возникновения термина. Сам по себе термин «Большие Данные» появился пять лет назад после публикации специального выпуска веду- щего американского научного журнала Nature, целиком посвященного этой теме. Затем тема, как по команде, была растиражирована сначала специализированными IT-изданиями, а затем подхвачена элитными СМИ, типа Foreign Affairs, Wall Street Journal и т.п.
Что же произошло пять лет назад? Есть ли какие-то документальные доказательства, что мы имеем дело с чем-то принципиально новым, а не с хорошо продуман- ной маркетинговой кампанией по принуждению прави- тельств и корпораций к покупке нового, дорогостояще- го софта? Ведь таких примеров в истории IT-индустрии было немало. В данном случае твердые документаль- ные доказательства перехода некоего Рубикона имеют место быть.
Во-первых, он связан с достижением интернетом уровня контентной зрелости и переходом в фазу ярко

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

выраженного экспоненциального развития. Эта фаза по- лучила название «информационный взрыв». Примерно, с 2008 года объем информации, вновь генерируемой в сети, стал удваиваться в течение примерно полутора- двух лет. На сегодняшний день можно привести следую- щие ключевые характеристики информационного взры- ва.
По данным компании Cisco, объем сгенерированных данных в 2012 году составил 2,8 зеттабайт и увеличится до 40 зеттабайт к 2020 г. Примерно треть передаваемых данных составляют автоматически сгенерированные данные, т.е. управляющие сигналы и информация, ха- рактеризующие работу машин, оборудования, устройств, присоединенных к интернету, или к интернету вещей. Причем с каждым годом доля интернета вещей или как его сегодня еще называют «интернета всего» растет в об- щем объеме мировых информационных потоков. На 40% ежегодно увеличивается объем корпоративной информа- ции, передаваемой и хранящейся в сети интернет.
Число пользователей интернета в мире к концу 2013 года составило 2,7 млрд. человек, или 39% населе- ния земли, а к 2016 году эта доля составит 65-75% насе- ления по данным Центра новостей ООН. Как ожидается, количество корпоративных пользователей интернета во всем мире увеличится с 1,6 миллиарда в 2011 году до 2,3 миллиарда в 2016 году.
Во-вторых, примерно в этот период времени появи- лись и стали доступны для корпоративных пользовате- лей принципиально новые IT-решения, позволяющие в режиме реального времени обрабатывать практически безразмерные массивы данных самого различного фор- мата. Причем эти решения сразу же стали реализовы- ваться не только как программные платформы, устанав- ливаемые на серверы, но и как облачные вычисления, где от организации не требовалось наличия дорогостоя- щей инфраструктуры компьютерного железа.

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

В-третьих, к концу нулевых годов западные, пре- жде всего, американские поведенческие и когнитивные науки, с одной стороны получили широкое признание бизнес-сообщества и государств, а с другой – из фазы ис- следований и разработок перешли в стадию производ- ства эффективных технологий. Косвенным показателем этого процесса стал тот факт, что в течение нулевых го- дов три виднейших представителя поведенческих наук: Д. Канеман, Дж. Акерлоф и Р. Шиллер получили Нобе- левские премии по экономике. Экономика была выбра- на лишь потому, что Нобелевских премий в сфере наук о человеке просто не существует.
Теперь давайте вдумаемся, чем же, по сути, являет- ся интернет. Причем без разницы, о каком интернете мы говорим – об интернете людей или об интернете вещей. Не надо обладать глубокими техническими знаниями, чтобы понять, что фактически интернет является храни- лищем, своеобразным архивом следов человеческой деятельности. Причем, не только той деятельности, ко- торая реализована в конкретных поступках, действиях, событиях, но и архивом намерений, мнений, мыслей и отношений. Не зря автор знаменитых бестселлеров Маршалл Смит уподобил интернет толще земли, в кото- рой можно обнаружить след доисторического животно- го, умершего миллионы лет назад. По сути, в интернете ничего не исчезает. Даже популярные в постсноуденов- скую эпоху различного рода сервисы удаления аккаун- тов и других следов пребывания в сети, удаляют лишь те следы, которые доступны для наблюдения простыми пользователями, не вооруженными специальными про- граммами, доступными для корпораций и государств.
Соответственно формирование огромного, постоян- но пополняющегося архива поведенческой активности самых различных субъектов, от отдельных государств и огромных компаний до небольших групп и отдельных индивидуумов собственно и послужило базисом появ-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

ления Больших Данных. C тех пор направление Больших Данных стало ведущим в сфере информационных техно- логий.
Анализ накопленного за последние годы опыта при- менения технологий Больших Данных позволяет выде- лить несколько ключевых черт, отличающих Большие Данные от всех других информационных технологий. К ним относятся:
• во-первых, огромные массивы разнородной ин- формации о процессах, явлениях, событиях, объектах, субъектах и т.п., пополняемые непрерывно в режиме он-лайн. Согласно имеющейся статистике 60% этой ин- формации носит неструктурированный, в основном тек- стовой характер и 40% составляет структурированная, или табличная информация. В последние годы в общем объеме Больших Данных постоянно нарастает доля ин- формации структурированного характера, поступающей от вещей, соединенных с интернетом – от холодильника до городской системы регулирования светофоров и т.п.;
• во-вторых, специально спроектированные про- граммные платформы, где Большие Данные любого объ- ема могут храниться в удобном для вычислений виде. Особо надо подчеркнуть, что эти архивы отличаются от привычных баз данных, которые приспособлены толь- ко для структурированной или табличной информации. Отличительной чертой этих хранилищ является то, что структурированная и неструктурированная информация могут обрабатываться совместно, как единое целое;
• в-третьих, наличие различного рода математиче- ского, прежде всего, статистического инструментария для обработки Больших Данных и получение результа- тов в виде, понятном для человека. Причем, при анализе Больших Данных используются не только традиционные методы математической статистики, но и алгоритмы рас- познавания образов, нейронные сети, построенные на основе аналогии с нервной системой и т.п.

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

По данным различных исследований, не более 0,6% всей имеющейся сейчас информации подпадает под ка- тегорию Больших Данных, т.е. накапливается, хранится и перерабатывается. В этих же исследованиях указывает- ся, что потенциально в качестве Больших Данных может использоваться 23% всей хранимой в настоящее время информации. Т.е. фактически сейчас из всей этой инфор- мации используется как Большие Данные, т.е. обрабаты- вается, анализируется чуть больше 3%. Между тем, по- следние достижения в области создания платформ на- копления, хранения и обработки объемов данных всех форматов позволяют увеличить потенциальные Боль- шие Данные с 23% до примерно 40% всей передаваемой в сетях информации.
Еще в 2011 году McKinsey Global Institute объявил Большие Данные «следующим рубежом для инноваций, конкуренции и производительности». По данным цело- го ряда ведущих международных деловых изданий, уже сегодня Большие Данные дают заметный эффект в биз- несе. Например, выяснилось, что в транснациональных компаниях, входящих в список Fortune 500, где, казалось бы, до мелочей отлажены все процедуры и процессы, внедрение технологий Больших Данных на 5-7% увели- чило эффективность использования ресурсов – труда, основных производственных фондов, энергии и т.п. и на 7-9% обеспечило рост объемов продаж. Для среднего бизнеса показатели оказались в полтора-два раза выше. Причем, следует отметить, что данные получены в услови- ях, когда мировая экономика испытывает на себе послед- ствия глубочайшего финансово-экономического кризиса и экономический рост измеряется в лучшем случае 1-2%. На чем же базируется эффективность Больших Дан- ных? Технологии Больших Данных и прежде всего, мето- ды статистического анализа, компьютерного распозна- вания образов и т.п., применяемые на огромных, посто-
янно
пополняемых
массивах
данных
позволяют:

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

• проводить самые различные и сколь угодно под- робные классификации той или иной совокупности лю- дей, компаний, иных объектов по самым разнообраз- ным признакам. Такие классификации обеспечивают точное понимание взаимосвязи тех или иных характе- ристик любого объекта – от человека до компании или организации, с теми или иными его действиями;
• осуществлять многомерный статистический и иной математический анализ. Этот анализ позволяет находить корреляции между самыми различными параметрами, характеристиками, событиями и т.п. Корреляции не от- вечают на вопрос – почему. Они показывают вероят- ность, с которой при изменении одного фактора изменя- ется и другой. В каком-то смысле Большие Данные пред- ставляют собой альтернативный традиционной науке метод. Наука на основе теоретических моделей отвечает на вопрос – почему, а затем, получив ответ, делает реко- мендации, как действовать. В случае корреляции стадия поиска причины ликвидируется, а действие происходит в тех случаях, когда факторы тесно взаимосвязаны и на один из факторов легко или возможно осуществить це- ленаправленное воздействие;
• прогнозировать. На основе классификаций и ана- литических выкладок осуществляется прогнозирование. Суть прогнозирования состоит в том, чтобы на основе корреляции определить наиболее легкий способ воз- действия для того, чтобы один набор факторов, харак- теризующих тот или иной объект, лицо, компанию, со- бытие и т.п. был преобразован в другой.
Как любой новый технологический пакет, Большие Данные тут же обросли мифами и заблуждениями. Мно- гие из них постоянно усиливаются как самими произ- водителями программных продуктов в сфере Больших Данных, так и средствами массовой информации, вы- нужденными адаптировать сложные вопросы информа- ционных технологий для читателей, не обремененных излишними знаниями.

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

Из всей совокупности мифов стоит выделить три главных. Именно они наносят наибольший вред техно- логиям Больших Данных и тормозят их практическое применение, в том числе в нашей стране.
Прежде всего, в маркетинговых целях приклады- ваются немалые усилия, чтобы представить технологии Больших Данных неким новым Святым Граалем. На них необоснованно возлагается роль панацеи от всех бед. Между тем, очевидно, что любой технологический пакет имеет строго определенные условия для своего приме- нения. Касательно Больших Данных таким ограничени- ем является сопоставимость текущей ситуации с ранее наблюдавшимися ситуациями, процессами, периодами времени и т.п. В качестве примера можно привести про- гнозирование потребительского поведения. Каждый человек на собственном опыте знает, что в ситуации умеренной инфляции он будет делать одни покупки, а при гиперинфляции его потребительское поведение ко- ренным образом изменится. Если уже имеются Большие Данные как по периоду с низким уровнем инфляции, так и ситуации гиперинфляционного шока, то технологии Больших Данных будут полезны. Они позволят распо- знать, к какому классу относится текущая ситуация, об- ратиться к соответствующим поведенческим паттернам, характеризуемым теми или иными параметрами, и по- зволят дать достаточно достоверный прогноз. А вот если Больших Данных по периоду гиперинфляции нет, а она наступила, то в такой ситуации технологии Больших Дан- ных будут бесполезны. Более того, их применение чре- вато непоправимыми ошибками. Этот пример показыва- ет: технологический пакет Больших Данных, также как и другие технологические пакеты имеют строгие условия, где его применение эффективно, а где – нет.
Бытует мнение, что Большие Данные могут приме- няться только государственными структурами и трансна- циональными корпорациями, и недоступны для других

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

субъектов. Связано это с дороговизной как серверной части, так и программных продуктов, требуемых для ра- боты с Большими Данными. И, наконец, с высокой зар- платой специалистов по Большим Данным. На практике в последние пару лет пользу из Больших Данных извле- кают не только гигантские, но и небольшие структуры. Это стало доступным благодаря облачным вычислениям. В этом случае небольшие структуры выступают конечны- ми пользователями технологического пакета, который получают как услугу. Использование этой технологии, как показывает опыт небольшого и среднего бизнеса в США, Западной Европе и Японии дает компаниям нео- споримые конкурентные преимущества по сравнению с бизнесами, которые подобными возможностями не рас- полагают.
Наконец, очень серьезным заблуждением является рассмотрение технологического пакета Больших Дан- ных как чисто машинной технологии. Многие государ- ственные и корпоративные структуры впустую затратили огромные суммы средств только потому, что все ресур- сы были направлены на закупку компьютерного железа и программных продуктов. При этом, затраты на кадры формировались по остаточному принципу. Между тем технологии Больших Данных требуют специалистов вы- сочайшего уровня квалификации, как правило, обладаю- щих образованием и профессиональными навыками не только в области информационных, но и гуманитарных наук. Сегодня, например, в США по оценкам экспертов не хватает от 50 до 70 тыс. специалистов по данным (data scientists). Большие Данные представляют собой не ма- шинную, а человеко-машинную технологию.
Это наглядно показал пример любимого детища АНБ, компании П. Тиля Palantir. Одна из версий про- граммы ориентирована на борьбу с мошенничествами в крупных финансовых структурах. Пока действовал чисто машинный вариант, система давала множество ложных

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

срабатываний. При этом полностью выявлялись и реаль- ные случаи хищений, но они были смешаны с неточны- ми выводами. В результате за программу посадили ве- теранов служб экономической безопасности в качестве операторов. За короткий срок они обучились работе с программой и, используя человеческий опыт, выбирали из всей совокупности сигналов лишь те, которые указы- вали на реальные хищения.
По этому поводу руководитель одной из самых пер- спективных компаний в области прогнозирования Quid, также принадлежащей П. Тилю, Ш. Горли сказал: «Наи- больший эффект Большие Данные дают тогда, когда возможности компьютеров в обработке гигантских мас- сивов информации и выявлении нетривиальных связей соединены с человеческим опытом и профессиональной интуицией. А все, что вам рассказывает Р. Курцвейл про искусственный интеллект, это как минимум на ближай- шее будущее просто красивые истории и PR-ходы».
Подытоживая суть технологий Больших Данных, можно согласиться с краткой формулировкой консалтин- говой компании Forrester: «Большие Данные объединя- ют техники и технологии, которые извлекают смысл из данных на экстремальном пределе практичности».
Большие Данные в первую очередь были использо- ваны в маркетинге, инвестиционном бизнесе, в прода- жах и т.п. Т.е. фактически там, где речь идет о косвенном, незаметном управлении поведением. Другой сферой применения Больших Данных стали процессы, описы- ваемые множеством параметров, где за счет изменения режима можно получить экономию того или иного ре- сурса. В этой связи за пределами маркетинга и продаж самыми активными пользователями Больших Данных стали государственные учреждения и энергетический сектор экономики.
Но это лишь надводная часть айсберга. А подводная часть, как известно, всегда намного больше и, если мож-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

но так сказать, серьезнее. Подводной частью айсберга стало использование технологий Больших Данных в та- ких сферах как разведка и контрразведка, военное дело, геостратегия и то, что традиционно называлось инфор- мационными войнами, а фактически представляет со- бой форму жесткого когнитивного противоборства.
Большие Данные были быстро осознаны такими странами, как Соединенные Штаты, Великобритания и Япония, в качестве важнейшего ресурса стратегическо- го значения. 29 марта 2012 года администрация Б. Оба- мы выступила с инициативой «Big Data Research and Development Initiative». Инициативой предусматривают- ся вложение значительных объемов ресурсов и прове- дение комплексных мероприятий в целях активного ис- пользования технологий Больших Данных на ключевых направлениях государственной политики США. В рамках инициативы ежегодно в Вашингтоне проводятся боль- шие конференции «Big Data for government & defense».
В сентябре 2013 года правительство Японии опубли- ковало информацию о разработке национальной про- граммы по Большим Данным. Летом того же года прави- тельство Австралии заявило, что рассматривает Большие Данные как важнейший национальный стратегический ресурс и выдвинуло задачу стать головной страной в сфере использования технологий Больших Данных как на правительственном уровне, так и на всех других уров- нях государственного аппарата в масштабах Британского Содружества Наций.

 

.2. Большие Данные в сетевом измерении
Долгие десятилетия в основе политтехнологий, методов жесткого информационного противоборства, конструкторов для проведения государственных пере- воротов и революций лежала так называемая «теория толпы». Она была разработана усилиями Лебона, Тарда, Конетти, Московичи и проч. Эта теория базировалась на

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

внешнем описании процессов. Как любая описательная теория она исходила частично из наблюдений, частично из картины мира самих исследователей. Тем не менее, теория, так или иначе, работала и построенные на ее основе методы давали определенный эффект. Едва ли не последним представителем школы «теории толпы» был Дж. Шарп с его книгами, включая работу «От дик- татуры к демократии». Однако сегодня с уверенностью можно сказать, что «теория толпы» описывает лишь не- большой фрагмент реальности.
В последние годы создана, по сути, новая наука – со- циодинамика, которая обобщает эмпирические законо- мерности, полученные в результате применения техно- логий Больших Данных к огромным массивам информа- ции, содержащейся в архивах крупнейших социальных платформ web 1 и web 2, таких как Google, Facebook, Twitter и т.п.
Эти эмпирические закономерности сегодня исполь- зуются для отработки практического инструментария внешнего воздействия, управления и манипулирования социальными группами любых масштабов и любого уровня структурированности, а также для сборки и де- струкции социальных субъектов. Именно применение Больших Данных к информации, полученной из соци- альных сетей, позволило осуществить прорыв в отработ- ке инструментария внешнего социального управления поведением.
Как правило, зарубежные работы о Больших Данных можно поделить на две основных группы. Одни заполне- ны техническими подробностями архитектурных реше- ний и интересны лишь профессионалам-айтишникам. Другие представляют собой набор красивых поучитель- ных историй об эффективности применения Больших Данных для решения тех или иных задач, прежде всего, в бизнесе. Читать такие истории весьма занимательно, но с практической точки зрения абсолютно бесполезно.

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

Поэтому мы постарались пойти третьим путем. Он заклю- чается в изложении результатов наиболее интересных исследований социодинамики и соответственно описа- нии тех самых, только что выявленных эмпирических за- кономерностей, которые используются для разработки нового инструментария социального конструирования и разрушения.
Научная группа Facebook с привлечением специали- стов из американских университетов, научных центров Европы и Азии провела исследование не только на ма- териалах Facebook, но и ряда других крупнейших сетей. Было установлено, что внутри глобальной сети существу- ют более-менее устойчивые субсети, или как их называ- ют на английском – паттерны.
Оказалось, что при всем многообразии этих пат- тернов, в конечном счете, они образуют восемь базо- вых структур. В основу типологии структур положена внутренняя конфигурация паттерна, плотность связей и структура внешнего взаимодействия паттерна с гло- бальной сетью или другими паттернами. Под внутрен- ней конфигурацией понимают взаимоотношения внутри паттернов между людьми с различными социальными ролями. Оказалось, и возможно это самое главное, что в каждом из восьми базисных паттернов информация распространяется различным образом и с неодинако- вой скоростью. Различаются также по этим паттернам взаимоотношения между онлайн и офлайн поведением. Фактически – это ключевое открытие. Оно позволяет за- метно увеличить эффективность внешнего управления групповым и массовым сознанием и поведением.
К. Марлоу, руководитель научной команды Facebook отметил, что им, вместе с исследователями Северо- Западного университета в Чикаго удалось обнаружить, что все сложные сетевые системы, например, такие как интернет, социальные сети, электросети и даже колонии термитов имеют множество сходных черт, характери-

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

зующих как динамику, так и статику этих систем. Более того, выяснилось, что во всех этих системах есть своего рода несущие узлы и элементы, которые образуют свое- го рода «скелет» сети, либо ее устойчивого паттерна. Собственно эти «скелеты» и определяют само существо- вание сетей, паттернов. В значительной степени от них зависит жизненный цикл сети и ее устойчивость к внеш- ним воздействиям.
Решающую роль в этой работе сыграл коллектив профессора А.Э. Барабаши. Еще в 2010 году А. Барабаши подключился к работам созданного на деньги Пентаго- на центра по исследованию социально-когнитивных се- тей (Social Cognitive Network Academic Research Center – SCNARC). Там перед ним была поставлена задача прак- тической проверки разработанных ранее теоретических моделей безмасштабных сетей на больших объемах реальных данных. Результатом работы А. Барабаши ста- ла статья «Достижение социального консенсуса в ре- зультате влияния убежденного меньшинства». В работе говорилось, что при достижении в социуме пороговой границы примерно в 10% убежденных сторонников какой-либо идеи, возникает лавинообразный процесс завоевания этой идеей умов большинства членов социу- ма. Начиная с 30% процесс становится необратимым. Но всего этого недостаточно. Нужно контролировать от 15 до 25 % драйверов сети. Отличие драйверов в том, что они не просто собирают информацию от разных людей и не просто являются источником информации для других участников сети. Их особенность в том, что они делают и то, и другое, выступая в роли коммуникаторов между группами людей и, как бы являясь информационными мостами, соединяющими изолированные островки ми- кросообществ, из которых обычно состоит любая соц- сеть. Поэтому настоящие драйверы – это не чемпионы Facebook по количеству друзей, и не чемпионы Twitter по количеству фолловеров. Это коммуникаторы, полу-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

чающие информацию от одних групп людей и передаю- щие ее другим группам. Принцип действует и в реале, и в виртуале.
Структура связей между драйверами сети в реале или в виртуале собственно и создает тот самый «скелет» сети, который выявили команды Facebook и Чикагского университета. Соответственно разрушение любой сети или сложного социального субъекта наступает не тогда, когда удается разрушить наиболее плотные связи внутри сети, а когда удается разрушить контакты между драйве- рами, или «скелет» сети.
Исследователи из Северо-Западного университе- та в Чикаго в сотрудничестве с группой из Массачусет- ского технологического института, установили, что для того, чтобы взять сеть или ее устойчивые паттерны под контроль и осуществлять внешнее управление ими до- статочно контролировать определенный процент участ- ников сети или паттернов. Этот процент, в зависимости от типа сетей и паттернов, колеблется в интервале от 10 до 80%. Проценты прямо определяются двумя параме- трами – плотностью связей внутри сети или паттернов и степенью однородности элементов, входящих в сеть или паттерн.
Жан Жак Слотин, профессор Массачусетского тех- нологического института отметил в этой связи, что для сетей, где элементами являются люди, т.е. социальных сетей в онлайне и офлайне, показатель контроля со- ставляет от 9 до 15%. Практически это означает, что если контролируется информационный поток или поведение от 9 до 15% участников сети, то в значительной степени контролируется и вся сеть или паттерн. Это относится и к небольшим группам, и к социальным сетям максималь- ного размера.
К. Марлоу в своих работах отмечает, что плотность социальных сетей гораздо выше, чем принято думать. Все хорошо знают правило шести рукопожатий. Оно гла-

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

сит, что любые два человека в мире увязаны через це- почку из шести человек. Это правило растиражировано и в научной, и в популярной литературе, вошло в обиход. А между тем, базируется оно всего на нескольких экспе- риментах, проведенных в одном городе, а именно в Бос- тоне во второй половине 70-х годов. Команда Facebook, используя имеющиеся данные, проанализировала све- дения на совокупности, составляющей 300 млн. поль- зователей сети в самых различных странах мира. Выяс- нилось, что для 98% пользователей Facebook действует правило не шести рукопожатий, а чуть больше четырех.
К неожиданным результатам привело недавнее ис- следование под руководством члена научной группы Facebook Э. Бакши. Его осуществляли коллеги из уни- верситета штата Мичиган. Эксперимент назывался «Эхо- камера». Суть его состояла в том, что исследовались пути распространения мемов и факторы, влияющие на отно- шение пользователей Facebook к тем или иным лицам, событиям, процессам. Эксперимент проводился на сово- купности 80 млн. аккаунтов. С одной стороны был полу- чен весьма ожидаемый результат, что распространение мемов зависит от конфигурации паттернов, а между пат- тернами решающую роль играет массовость охвата ме- мом участников сети в целом. Гораздо более неожидан- ным оказался другой вывод. До эксперимента все были уверены, что на отношения участников паттерна решаю- щее влияние оказывает позиция по этому вопросу других его членов, или как еще их называют «близких друзей». Выяснилось, что это не так. Слабые связи, т.е. позиция сети в целом или большого его фрагмента, куда входят несколько паттернов, оказывает большее влияние, чем позиция «близких друзей». Результат был настолько неожиданный, что эксперимент был трижды повторен и дал те же результаты. Не менее удивительным оказался тот факт, что мнение в виртуале может существенно рас- ходиться с поведением в реале. Кроме того, оказалось,

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

что в реале зачастую действуют несколько иные законы, чем в виртуале.
Присцилла Чан, жена Марка Цукерберга попросила его использовать возможности Facebook для увеличения добровольных бесплатных доноров крови в США. Цукер- берг попросил научную группу предложить стратегию и практические инструменты реализации этой програм- мы. При анализе результатов программы выяснилось, что при переходе из онлайна в офлайн ситуация меняет- ся. Если на виртуальное мнение более сильное влияние оказывают слабые связи, то на реальное поведение боль- ше воздействуют сильные связи. Фактически технология научной группы была построена на том, чтобы с одной стороны обеспечить максимально быстрое распростра- нение мема «донор – это круто» по сети и создать этому мему климат максимального благоприятствования, а с другой стороны побудить наиболее влиятельных членов паттернов показать пример реальным поступком. До- стигнуто это было путем отправления им персональных посланий за подписью Цукерберга, содержащим поми- мо просьбы не очень значащую, но приятную бесплат- ную «плюшку».
Недавно вышла публикация центра Беркмана по из- учению информации и общества при Гарвардском уни- верситете. Исследование проводилось на материале мо- ниторинга веба и непосредственно полевых работ в Ту- нисе, Египте, Ливии, Йемене. Было выделено три аспекта влияния социальных сетей на политические процессы, прежде всего, в арабском мире, а именно – коммуни- кационный, мобилизационный и информационный. Ис- следователи из Гарварда сделали однозначный вывод о том, что мобилизационная роль социальных сетей в событиях в противовес мнению СМИ и блоггеров была весьма невелика. Различного рода виртуальные сообще- ства не придали сколько-нибудь массового характера выступлениям. Решающей технологией мобилизации

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

стали
пятничные
молитвы
и
обращения
мулл.
Коммуникационный фактор социальных сетей, без- условно, присутствовал. Более того, как было выявлено и по результатам мониторинга, и по результатам поле- вых исследований, он нарастал по мере развития собы- тий. Т.е. на первом этапе коммуникация шла в основном вживую и через банальные телефоны, но дальше все чаще стали использоваться платформа Twitter и соци- альные сети.
Наиболее заметную роль социальные сети сыграли в части информационного освещения событий в араб- ском мире и во всемирном медийном пространстве. Результаты исследования убедительно показали, что со- общения в Twitter и социальных сетях оставляла ничтож- но малая часть участников событий. В их число входили, прежде всего, агитаторы, или ангажированные блогге- ры. Кроме того, среди них было немало и тех, кто писал то, что думал, или выкладывал видео, которые реально снимал. При этом именно сообщения ангажированных блоггеров в значительной степени использовались ми- ровыми онлайн СМИ всех форматов и формировали ин- формационные потоки. Частично здесь имел место фак- тор целенаправленного использования фрагментарной информации в целях манипулирования общественным мнением. Но главным, по мнению исследователей из Гарварда, было то, что именно такая технология форми- рования новостей встроена в производственные процес- сы мировых интернет- и офлайн-СМИ. Т.е. так произошло не только потому, что кто-то целенаправленно занимал- ся манипуляциями, но и потому, что это соответствовало отработанным технологиям подачи новостей в режиме нон-стоп.
Широко обсуждаются результаты промежуточных исследований Института анализа социальных и полити- ческих конфликтов Джорджтаунского университета. Этот университет является одной из ведущих «фабрик мыс-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

ли», обслуживающих, прежде всего, Госдепартамент и Со- вет национальной безопасности. Институт вот уже девять лет ведет тему «Квазитолпа в политических событиях».
Еще в прошлом веке Г. Лебон написал свою знаме- нитую работу о толпе. В ней сформулировано и клас- сическое понимание толпы, как большого, в каком-то смысле даже избыточного количества людей, оказавше- гося в определенное время в конкретном месте. Квази- толпа отличается от толпы тем, что представляет собой толпу, которая собралась не случайно из-за стечения тех или иных обстоятельств, либо объективных процессов, а была собрана сознательно, либо собралась в результате каких-то общественных процессов.
Уникальность этого исследования состоит в том, что феномен квазитолпы изучался не только на материале арабского мира, но и Западной Европы, конкретно, со- бытий в Лондоне, Париже, Берлине в последние годы, США («Оккупай Уолл-стрит»). В результате исследова- ний, которые велись с привлечением специалистов из МТИ и Северо-Западного института, выяснились очень интересные вещи. Для каждой из стран имеется свой критический порог численного состава квазитолпы, ког- да она начинает играть активную роль в политических, социальных и экономических процессах, прежде всего, на региональном, городском и территориальном уровнях. Этот порог зависит от численности населения в ключевых городах, культурных особенностей, национального тем- перамента и компьютерной вооруженности населения.
В исследовании установлено, что квазитолпа пре- вращается в своего рода устойчивый субъект действия, способный собираться с определенной периодичностью при выполнении условий, связанных с ее структурным составом. Конкретно речь идет о следующем. Ранее счи- талось, что в квазитолпе четко выделяются три группы участников. Это «заводилы», выступающие организато- рами квазитолпы и первыми выходящие на площади и

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

улицы. Вторая – «регулярные бойцы». Это – участники квазитолпы, склонные к жесткому противодействию с властью и органами правопорядка, как правило, беру- щие на себя основной удар при попытках сдержать или рассеять квазитолпу. Третья – «примкнувшие». Это те, кто откликается на призыв заводил, и является массов- кой для бойцов. Впервые структура квазитолпы была рас- крыта исследователями из Лондонской школы экономики на примере анализа движения британских футбольных болельщиков – ультрас в 70-е годы прошлого века.
Проведенные в последние годы исследования за- ставили посмотреть на квазитолпу несколько по-иному. Квазитолпа понимается не как простое объединение большого числа людей, а как единое целое, состоящее из людей и групп, объединенных сильными, слабыми и очень слабыми связями. Выяснилось, если в квазитолпе не менее 7-15% людей принадлежат к группам, внутри которых имеются сильные связи, то это необходимый но недостаточный фактор превращения квазитолпы в ре- альный фактор действия. Что это за группы? Это не орга- низаторы квазитолпы, а люди, которые влились в нее не поодиночке, а группами, которые тесно взаимодейству- ют в реале и общаются в виртуале. Эти группы становятся центрами притяжения и стабилизации квазитолпы. Они же в значительной степени втягивают в себя понемногу остальных членов квазитолпы. Про эти группы было из- вестно и раньше.
А вот третий компонент квазитолпы четко выделен впервые. Выяснилось, что в квазитолпе, которой удалось стать субъектом действия, обязательно присутствовали микрогруппы, выполняющие роль катализаторов. Их численность должна составлять от 2 до 5% от общего чис- ла участников квазитолпы. Это люди, которые наиболее активно ведут себя в квазитолпе, а также оказываются первыми при любых конфликтах и столкновениях. Было бы упрощением, как показали результаты исследований,

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

всех их без исключения относить к провокаторам. Конеч- но, провокаторы в ряде случаев составляют большинство этой группы, но немалая часть людей, попавших в ука- занную категорию – это участники квазитолпы, которые по своим личностным и социально-психологическим ха- рактеристикам, культурным стереотипам и возрастным особенностям склонны к импульсивным действиям, имеют низкий порог сдерживания страхом и т.п. Иссле- дованиям этой категории в России длительное время с успехом занимается д.ф.н. И. Сундиев. Очень интересно, что согласно анализу института, эта группа в значитель- ной степени формируется и рекрутируется в социальных сетях. По численности они ничтожны, но последствия их деятельности очень велики. И это не удивительно, по- скольку динамика квазитолпы – это чисто синергетиче- ский процесс. При таких процессах даже малые измене- ния могут привести к очень большим последствиям.
Имеется много свидетельств, что для того, чтобы квазитолпа превратилась в субъект действия, одних про- цессов самоорганизации недостаточно. Должно присут- ствовать внешнее управление со стороны тех, кто сам ни в коем случае не участвует в квазитолпе, а обеспечивает своего рода логистику, финансирование и т.п. Проще го- воря, каждому кукольному театру нужен свой Карабас- Барабас. Хотя в реальности обычно действует не инди- видуальный, а коллективный Карабас.
Значительный интерес вызвала недавняя работа Парижского центра изучения социальных, этнических и межконфессиональных конфликтов о взаимоотношени- ях виртуальных и реальных социальных сетей и групп в конфликтных ситуациях. Исследование имело целью вы- яснить вопрос, какие именно виртуальные группы бы- стрее всего самоорганизуются в конфликтных ситуациях и способны к согласованным действиям. В качестве ма- териалов были использованы данные по беспорядкам в Париже, событиям прошлого года в Тунисе, футбольным

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

беспорядкам в центральной Германии. Было выделено три типа групп: полностью виртуальные группы, которые до событий не имели между собой никаких контактов в реале, смешанные группы, где часть людей взаимодей- ствовала в реале и все взаимодействовали в социальных сетях и, наконец, реальные группы, все члены которых многократно пересекались и взаимодействовали в ре- альном мире.
К некоторому удивлению исследователей выясни- лось, что наибольшей способностью к самоорганизации обладают не реальные, как это предполагалось до сих пор, а смешанные группы. Под самоорганизацией име- лась в виду способность людей на месте события быстро идентифицировать себя как единое целое и, кроме того, увеличивать численность группы за счет включения в нее других участников конфликтов или беспорядков. Оказалось, что реальные группы быстрее всех переходят к действиям, но с трудом коммуницируют с толпой на месте конфликтов или беспорядков. В то же время сме- шанные группы немногим уступали реальным группам в скорости перехода к тем или иным активным действиям, намного превосходят их по способности вбирать в себя неорганизованных участников конфликтов и беспоряд- ков и просто людей, оказавшихся в это время в соответ- ствующем месте.
Далее исследователи выяснили, что во всех странах наблюдения в смешанных группах наиболее авторитет- ные их члены связаны между собой не только виртуаль- ными, но и реальными взаимодействиями. При этом число участников смешанной группы, имеющих устойчи- вые реальные взаимодействия, колеблется, как правило, в интервале от 10 до 25% от общей численности группы. Международный центр практик краудсорсинга при стихийных бедствиях опубликовал данные аналитики, которую они провели по отражению в социальных сетях и Twitter наводнения в Новом Орлеане, землетрясения

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

на Гаити, катастрофы вокруг Фукусимы и наводнений в результате разливов Красной реки.
Аналитику для центра вели специалисты Универси- тета И. Лойолы, который, кстати, является поставщиком кадров для разведсообщества, при поддержке лабора- тории аналитических методов обработки неструктури- рованный информации Стэндфордского университета. Было выявлено два новых неожиданных и технологиче- ски очень интересных обстоятельства.
Во-первых, оказалось, что социальные сети имеют различную пропускную способность в зависимости от оценочной окрашенности информации. Давно и хоро- шо известно, что наиболее рейтинговыми передачами на телевидении оказываются различного рода шоу, со- ревнования и т.п., имеющие, несомненно, положитель- ную окрашенность, несущие позитивные эмоции. В со- циальных сетях, напротив, скорость распространения и широта охвата негативной информации в 2-2,6 раза превышает аналогичные показатели для позитивных но- востей и сообщений. Данные цифры получены впервые и естественно в ближайшее время будут осмыслены и с военных, и с политических, и с коммерческих позиций.
Во-вторых, выяснилось, что люди, оказавшиеся в зоне стихийных бедствий, как это не удивительно, ис- пользуют социальные платформы и социальные сети достаточно неожиданным образом. До проведения ис- следований и эксперты, и практики были убеждены, что социальные платформы и сети в зонах бедствия и экс- траординарных событий используются, прежде всего, для того, чтобы подать призывы о помощи, просигнали- зировать властям или добровольческим организациям о необходимости предпринять усилия для спасения тех, кто выходит с соответствующими сообщениями. Ока- залось, что такие сообщения составляют по различным регионам от 27 до 38% от общего числа осмысленных со- общений. При этом наибольший удельный вес призывов

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

помощи имел место на Гаити и при разливах Красной реки. Наименьший – в Японии.
Самыми распространенными сообщениями, на ко- торые приходилось от 40 до 52% от общего количества осмысленных сообщений составили твиты и записи в со- циальных сетях, которые имели своей целью сообщить родным и близким о своем местоположении и самочув- ствии и наладить с ними эффективное взаимодействие. Фактически речь идет о том, что эти сообщения име- ли своей целью запустить процессы самоорганизации групп, находящихся в зонах стихийных бедствий. Причем, состав этих групп входили люди, как правило, имеющие тесные связи в реале, либо устойчивое взаимодействие в виртуале. В общем, оказалось, что старая и вечно мо- лодая фраза из еще советского фильма: «Спасение уто- пающих – дело рук самих утопающих» как нельзя лучше отображает реалии вне зависимости от географической локализации. Наконец, третью группу сообщений соста- вила информация о состоянии инфраструктуры в зонах стихийных бедствий. Как показал дальнейший анализ, эта информация по всем проанализированным районам оказалась на порядки более точной, чем передаваемая в то же время в онлайн режиме информация со стороны государственных и других официальных структур.
Недавно известный американский социолог и пси- холог П. Голвиттцер опубликовал переиздание книги
«Символическая самореализация». В ней впервые на суд экспертов и практиков были представлены резуль- таты более чем семилетних экспериментов, характери- зующих взаимоотношения между высказанными наме- рениями и практически реализованными действиями. Исследования охватили почти 50 тыс. человек в Амери- ке, Европе и Азии. Вне зависимости от региона, культур- ной принадлежности и возраста, выяснилось, что те, кто хранил свои намерения при себе, были более склонны

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

их достигать, чем те, кто оглашал их и при этом получал высокую оценку от других.
Профессор психологии Нью-Йоркского университета П. Голвиттцер выяснил, что намерение, будучи высказан- ным и оцененным, формирует самооценку человека и снижает побудительные мотивы к практическим после- дующим действиям. Поскольку профессор начал свои эксперименты еще в 1982 г., в доинтернетную эру, ему удалось посмотреть на динамику расхождений между намерениями и действиями во времени. Он выяснил, что это расхождение стремительно нарастает и строго коррелируется с повышением доступности интернета и распространением социальных сетей. Отсюда П. Гол- виттцер сделал вывод, что социальные сети имеют еще один неожиданный аспект. Для значительной части на- селения они выступают как своеобразная машина «за- балтывания», блокирования действий за счет коммуни- кации и одобрения со стороны сообщества высказанной точки зрения. Получив одобрение, люди в некоторой степени теряют побудительные мотивы для осуществле- ния практических, подчас связанных с риском или не- приятностями действий.
Как явствует из материалов проведенных в послед- нее время конференций с участием ведущих американ- ских и британских исследователей, политиков, военных, представителей разведывательного сообщества, бизне- са сложилась четкая точка зрения, что любыми социаль- ными сетями, сообществами и группами можно эффек- тивно управлять, если знать закономерности формиро- вания и динамики, а также характеристики групп любых масштабов и структур. На страницах ведущих американ- ских СМИ мелькает применительно к синтезу технологий Больших Данных и сетевых исследований эпитет «новая ракетная наука». На американском политическом сленге
«новая ракетная наука» – это сфера науки и технологий, способная обеспечить максимальные разрушительные

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

и созидательные эффекты, а также имеющая двойное применение, и в военной, и в гражданской областях.
В этой связи хотели бы отметить следующее. Вряд ли стоит ожидать в ближайшие годы появления обобщен- ного труда, типа известных работ Д. Шарпа и Д. Ная. По сути, речь идет о полусекретных разработках. Однако, в силу особенностей финансирования американской нау- ки, практически все значимые результаты исследований публикуются в открытой печати, как правило, в платных научных журналах, размещенных в так называемом «не- видимом» интернете. В этой связи важнейшей практиче- ской задачей является каждодневный мониторинг таких публикаций, их своевременная оценка, классификация, включение новых методов в общесистемный арсенал цифровых социумных вооружений и опережающая раз- работка средств борьбы с новыми угрозами.

 

.3. Прогностические вооружения и Большие Данные
Прогнозирование в сфере высшей политики, экономики и военного дела всегда имело амбивалент- ную, а по-русски говоря, двойственную природу. С одной стороны прогнозирование являлось важнейшей стади- ей разработки ключевых стратегических, тактических и оперативных решений тех или иных проблем и задач, разработки и реализации крупных проектов и военных компаний. С другой стороны, прогнозирование, подкре- пленное мощным информационно-пропагандистским аппаратом, само по себе выступало как своеобразный вид вооружения, способ формирования будущего.
После знаменитых экспериментов американского социолога У. Томаса, прогнозы, подкрепленные соот- ветствующим информационным воздействием, сами по себе формируют реальность. Как гласит теорема Томаса:
«Если человек определяет ситуацию как реальную, она – реальна по своим последствиям». Другой американский

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

социолог, а по совместительству советник администра- ций нескольких президентов Р. Мертон на основе теоре- мы Томаса опубликовал статью «Самоисполняющиеся пророчества». Самоисполняющееся пророчество – это ложное определение ситуации, вызывающее новое по- ведение, которое превращает первоначально ложное представление в реальность. Таким образом, теорема Томаса вкупе с технологией Мертона позволяют исполь- зовать прогнозирование как мощное оружие в социоди- намике, психоинжиниринге, военном деле и бизнесе.
Поэтому вполне очевидно, что с развитием интер- нета и появлением Больших Данных, представляющих собой, в том числе и огромный поведенческий архив, возникло желание максимально использовать открыва- ющиеся возможности для разработки прогностических вооружений.
При этом к началу нулевых годов профессионалам, работающим в этой сфере, были ясны, по меньшей мере, три фундаментальных положения:
• во-первых, используя самые изощренные и эффек- тивные методы, можно прогнозировать процессы, но не события;
• во-вторых, прогнозы с высокой степенью вероят- ности можно делать в отношении групп различной раз- мерности, но не отдельных индивидуумов;
• в-третьих, знания о действиях групп и индивидуу- мов в одной ситуации не позволяет давать точные про- гнозы о подобных действиях, осуществляемых в другой ситуации.
Соответственно, оказалось, что различного рода прогнозы, базирующиеся на традиционных выборках, построении сценариев, экстраполяции попросту не ра- ботают.
Развитие интернета дало возможность оперировать Большими Данными относительно человеческого пове- дения, намерений, желаний и т.п. В этой связи специа-

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

лист номер один в мире по интеллектуальному анализу данных Г. Пятецкий-Шапиро писал: «Прогнозирование на основе Больших Данных состоит в извлечении нетри- виальных выводов из заранее известных характеристик, признаков и сведений об объектах».
Использование интернета, как огромного, попол- няемого в режиме он-лайн поведенческого архива для прогнозирования развивается по трем ключевым на- правлениям:
• первое – это прямой интеллектуальный анализ общедоступных данных, предоставляемых поисковыми системами и различного рода социальными сетями и платформами;
• второе – это создание рекомендательных систем, которые прогнозируют различного рода выбор субъектов и групп, и на этой основе рекомендуют им что угодно – от книг до кандидатов в президенты;
• третье – это сложные прогностические системы, использующие разнородные данные, получаемые из открытой и закрытой части всемирной сети, обрабаты- ваемые с помощью всего арсенала интеллектуального анализа данных.
Исторически главный упор был сделан на работу с об- щедоступными интернет-данными из социальных сетей и поисковых машин. Еще два-три года назад никто не мог помыслить о том, что инструменты веб-прогнозирования будут в благожелательном ключе обсуждаться на сайте головного банка ФРС. Но это произошло. Первым делом, как всегда бывает, за дело взялись академические иссле- дователи, которые в Америке очень даже прагматически настроены и заинтересованы в максимально быстром внедрении их научных разработок в практику. В октябре 2010 г. в кругах инвестиционных аналитиков прогремел доклад Johan Bollen, Huina Mao (Indiana Unviersity), Xiao- Jun Zeng (The University of Manchester) «Twitter mood predicts the stock market».

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

Ими была сделана программа, которая позволяла использовать сообщения Twitter для прогнозирования движения индекса Dow Jones. Алгоритм работал сле- дующим образом – отбирал из всех Twitter сообщений в режиме реального времени сообщения, маркирован- ные определенными словами, затем удалял эмоцио- нально окрашенные сообщения и на основе обработки нейтральных, эмоционально не окрашенных сообщений выдавал прогноз. Выяснилось, что он позволил предска- зывать движение индекса на срок от двух до шести дней с точностью почти до 88%.
Большое признание в последнее время в Америке получили разработки Р. Петерссона, исследователя из Стэндфордского университета. В качестве неструктури- рованных данных для прогнозирования он использовал не Twitter, а контент социальных СМИ, т.е. платформ, где контент создают сами пользователи. Таких платформ с качественным контентом в англоязычном интернете на- считывается сотни.
Его исследования были восприняты компанией MarketPsych. Был создан прогностический модуль. Он уверенно дает при достаточно консервативной страте- гии 30% прибыли в год. В настоящее время эта компания приобретена крупнейшим информационным провай- дером, всемирно известным Thompson Reuters. Соот- ветственно прогнозы получают подписчики Thompson Reuters, интересующиеся инвестиционной и политиче- ской тематикой.
Совсем недавно за разработку системы, аккумули- рующей информацию Twitter для трейдинга, взялась компания Titan Trading Analytics. В своей системе они ис- пользуют 1500 ключевых слов и более 600 факторов. Как видим, создание и практическое использование про- грамм прогнозирования, базирующихся на неструкту- рированных данных web 2 и прежде всего Twitter, стало

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

сегодня повсеместной практикой инвестиционных, ма- кроэкономических и политических аналитиков.
Огромную роль в современном геополитическом, военном и инвестиционном прогнозировании играют общедоступные данные, связанные с частотой поис- ковых запросов, которые постоянно публикуют главные поисковики мира, прежде всего, Google и Bing. В нынеш- ней реальности любой поисковый запрос представляет собой фиксацию процесса мышления о чем-то. Он пока- зывает нам объект этого мышления, его последователь- ность и многое другое. Когда интернет с одной стороны стал доступен для подавляющего большинства жителей в развитых странах в режиме онлайн нон-стоп, а с другой, пользователи приучились к интернету, как к источнику мгновенного получения любой интересующей информа- ции, использование поисковиков для прогнозирования стало возможным.
К настоящему времени независимыми группами ис- следователей, использующих различные методы и алго- ритмы обработки поисковых запросов в целях прогнози- рования установлено, что особым образом обработанная статистика поисковых запросов может выполнять роль опережающих индикаторов для целого ряда рынков и экономических параметров. В частности, это относится к динамике безработицы в США, Германии, Франции; динамике потребительских расходов на рынках электро- ники США, странах ЕЭС, Канаде; ценам на недвижимость США и Великобритании; биржевым индексам на «голу- бые фишки» на Нью-Йоркской и Лондонской биржах и фьючерсам на биржевой индекс китайских акций на Гон- конгской бирже.
Уже полгода Министерство здравоохранения США успешно использует систему, построенную на анализе поисковых запросов для опережающего мониторинга и прогнозирования различного рода эпидемий в стране. На сегодняшний день обнаружено более 50 показателей,

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

относительно которых поисковая статистика Google мо- жет быть использована как опережающий индикатор.
Вторым, бурно развивающимся направлением про- гнозных вооружений, являются так называемые реко- мендательные системы. Эти системы базируются на тща- тельном анализе поведения человека в сети. При этом анализируются не только его желания, высказанные в виде различного рода поисковых запросах, но и поведе- ние на сайтах крупных интернет-магазинов – например, что человек ищет, как долго рассматривает что-либо и т.п. Используется здесь так называемый неявный сбор данных, когда все действия человека в сети протоколи- руются. Затем, на основе сложных алгоритмов выдаются рекомендации, которые подталкивают человека к тому или иному выбору. Наиболее известные рекомендатель- ные системы созданы Amazon для книг и других товаров, продаваемых на этой универсальной платформе, eBay, Cinemax.com (рекомендации в отношении фильмов, де- монстрируемых в кинотеатрах), Videoguide (для потоко- вого видео) и т.п.
Во время последней избирательной кампании ко- манда Б. Обамы, договорившись с крупнейшими реко- мендательными платформами, успешно использовала их опыт для рекомендации Б. Обамы в качестве лучшего выбора для выявленных опять же по специальным ал- горитмам колеблющихся избирателей и людей, которые вообще не собирались идти на выборы. По оценкам американских экспертов использование этой системы сыграло едва ли не решающую роль в победе Б. Обамы в кампании 2012 года.
Сегодня крупнейшие банки являются клиентами рекомендательной германской компании Kreditech. Гамбургский стартап Kreditech использует во время при- нятия решений информацию, почерпнутую из Facebook. Людей, претендующих на получение кредита, просят на время предоставить доступ к их учётной записи в

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

Facebook или других социальных сетях. По словам Алек- сандра Граубнера-Мюллера, одного из основателей фирмы, список ваших друзей выдаёт немало. Претен- дент, приятели которого прилично зарабатывают и жи- вут в хороших районах, имеет больше шансов на кредит. Претендент, знакомый которого отказался возвращать деньги, занятые у Kreditech, ничего не получит.
В качестве одного из наиболее ярких примеров сложных прогнозных систем можно привести проект Recorded Future. В январе 2010 года проект Recorded Future был запущен за счет инвестиций Google, инвести- ционного фонда американского разведывательного со- общества In-Q-Tel и собственных вложений К. Альберга – основателя проекта, в прошлом шведского разведчика и известного программиста.
Recorded Future базируется
на
трех основных
блоках:
• Встроенном поисковике третьего поколения. В пер- вом поколении были системы типа Yahoo и HotBot. Они искали просто те или иные слова в документах и выдава- ли документы в произвольном порядке. Поэтому такого рода поисковики сопровождались каталогами, форми- ровавшимися в основном экспертами на основе поис- ковой выдачи. Нечто подобное можно до сих пор уви- деть на первой странице Rambler. Вторым поколением стал Google. Революция Брина-Пейджа состояла в том, что поисковик стал искать не только по документам, но и в значительной степени по связям между документами или сайтами. Третье поколение ищет не только объекты, соответствующие поисковым запросам, не только связи между документами, но и взаимосвязи между объекта- ми, их характеристиками и отношениями, содержащи- мися в различных документах. Сегодня это главное на- правление развития поиска. Оно в полной мере реали- зовано в Recorded Future.
• Разделении информационного поля на составляю- щие. В Recorded Future выделено три класса сообщений.

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

Первый – это сообщения о событиях. События – это для- щиеся определенный, достаточно небольшой период времени устойчивые конфигурации, которые характери- зуются единством времени, места, участников и т.п. К со- бытиям Recorded Future относит то, что может быть ин- терпретировано как факты, то, что реально произошло или происходит в данный момент. Второй – это мнения. К мнениям относятся любые сообщения относительно прошлых, настоящих или будущих событий, высказан- ные в авторитетных источниках, либо авторитетными людьми. В системе есть специальные алгоритмы, кото- рые позволяют для каждой области выделить большую выборку таких источников и персон. Наконец, третий – это реакции. Здесь принимаются во внимание любые спонтанные реакции людей на те или иные ожидаемые события, зафиксированные в различного рода тексто- вых сообщениях. Не обязательно, чтобы эти сообщения были из авторитетных источников. Главное, чтобы они имели отношение к событиям и мнениям, так или ина- че рассматриваемым и высказываемым в авторитетных источниках. Такое разделение на три сегмента информа- ционного поля, как выяснилось, позволяет достаточно хорошо улавливать как господствующие тенденции и опережающим образом реагировать на их изменения, так и выявлять слабые сигналы.
• Рассмотрении интернета, как огромной распреде- ленной сетевой базы неструктурированных данных. Еще у древних греков были знаменитые Мойры, которые пря- ли нити судьбы, образующие ткань реальности. Сестер было три. Первая олицетворяла, как мы теперь говорим, тренды. Вторая – случайности. Третья – неотвратимость последствий поступков и решений. Собственно Recorded Future использует поисковик, работающий в сегменти- рованном информационном пространстве в масштабе огромной сетевой базы данных. В сетевой базе данных разные объекты и их характеристики связаны друг с дру-

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

гом прямыми, обратными и опосредованными связями. Соответственно, такой подход позволяет выявлять не только явные и очевидные связи, но и вести так назы- ваемый латентный анализ, т.е. получать неочевидные, а иногда даже и абсолютно не предполагаемые связи и от- ношения. К тому же обрабатывать огромное количество информации в алгоритмическом режиме. Т.е. опериро- вать информационными массивами, непосильными для непосредственной обработки человеком.
В настоящее время Recorded Future используется в трех сферах: государственной разведке и безопасности, в бизнесе, и в финансах для разработки инвестиционных стратегий.
Другим ярким примером прогностических систем нового поколения является платформа Quid. Эта систе- ма создана известным американским программистом и разработчиков Ш. Горли на деньги знаменитого Питера Тиля, чья разведывательная программа Palantir является любимым инструментом американского разведыватель- ного сообщества.
Quid занимается прежде всего научно-техническим прогнозированием, поиском тех ниш, которые могут дать максимальный эффект с точки зрения развития техноло- гий в любых сферах, включая сферу вооружения. Одно- временно система может быть использована как свое- го рода организационное оружие, поскольку выявляет, образно говоря, технологические дыры в потенциале любой страны мира. В качестве материала для прогно- зирования программа использует Большие патентные Данные, т.е. миллионы файлов, входящих в патентные базы по всем странам мира, а также информацию, по- черпнутую из научно-технических, технологических жур- налов и средств массовой информации.
В основе системы лежит простая, но очень эффек- тивная мысль. Впервые она была высказана более 50 лет назад знаменитым польским мыслителем и фантастом

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

С. Лемом. Идея состоит в том, что техника развивается примерно по тем же законам, что и живая природа. Как известно, в живой природе существует такая ключевая единица, как биоценоз, в который входят различного рода живые виды, составляющие пищевые цепочки, системы взаимодействия и в совокупности полностью заполняющими природный ландшафт. С. Лем предполо- жил, что то же самое происходит в технике. И назвал это техноценозом. Система Ш. Горли обнаруживает такие техноценозы, ищет в них пустые, незаполненные места. Именно эти пустые места оказываются точками роста, где появляются наиболее эффективные и одновремен- но наиболее прибыльные технические и технологиче- ские решения. С другой стороны, если это пятно не бу- дет заполнено, то система техноценоза будет уязвимой, неустойчивой и плохо приспособленной к дальнейшему развитию. За 2,5 года работы компании Ш. Горли ее кли- ентами стали ведущие американские корпорации, раз- ведывательные и военные структуры.
Таким образом, Большие Данные обеспечили по- явление новых, на порядки более эффективных, чем раньше, методов прогнозирования научно-технических, инженерно-технологических, инвестиционных, поли- тических, социальных и военных процессов. Эти мето- ды в совокупности с методиками глубокого анализа на основе все тех же Больших Данных позволяют говорить о создании принципиально нового вида вооружений, а именно – прогностических вооружений. Они могут быть использованы как обеспечивающий механизм для раз- работки и применения традиционных вооружений, так и при определенных условиях, о которых расскажем в сле- дующих статьях, как отдельный, принципиально новый вид вооружений. Более того, они становятся своего рода основой Shadow Power или невидимой силы, которая идет на смену мягкой силе.

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

.4. Большие Данные, фруктовые салаты и Большой Брат
Американская психология в отличие от направ- ленности этой науки в других странах мира, прежде все- го, в континентальной Западной Европе, России, Велико- британии, отличалась подчеркнуто практическим харак- тером. Фактически с первых дней существования на аме- риканском континенте, психология сразу же была взята на вооружение рекламистами, политическими пропа- гандистами и маркетологами. Они рассматривали ее как поставщика инструментов для решения каждодневных, практических задач. Инструментальная направленность американской психологии в значительной мере привела к тому, что ведущие университеты старались заполучить к себе уже известных, прежде всего в Европе, исследо- вателей. Цель была не в том, чтобы создавать научные школы, а использовать уже имеющиеся наработки.
Собственно, таким образом родилось едва ли не го- сподствующее направление в американской психологии, так называемый бихевиоризм. В переводе на русский оно означает науку о поведении. Наиболее яркие фигу- ры бихевиоризма Дж. Уотсон и Б. Скиннер, не скрыва- ли, что их разработки имеют в основе труды российской психофизиологической школы и, прежде всего, И.П. Пав- лова, И.М. Сеченова и В.М. Бехтерева.
Бихевиористы считали, что с практической точки зрения бессмысленно использовать различного рода те- сты, наблюдения за внутренним миром человека и т.п. Они исходили из того, что базироваться можно только на объективных, т.е. наблюдаемых данных, которые к тому же должны иметь количественное выражение. Бихе- виористы полагали, что каждому стимулу соответствует строго определенная реакция человека.
На практике дело оказалось, естественно, более сложным. В своем дальнейшем развитии бихевиорист- ская школа стала учитывать не только реакции челове-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

ка на те или иные стимулы, но и ситуации, в которых он действует. Наряду с этим, благодаря Курту Левину, би- хевиоризм обогатился таким важным элементом, как открытие канального, или тоннельного эффекта. Смысл этого эффекта достаточно прост. Оказалось, что для каж- дой группы людей существуют внешне незначительные факторы, стимулы или другие характеристики, воздей- ствуя на которые можно добиться заметного изменения в поведении, в том числе в отношении значимых его па- раметров. Этот вывод был проверен на тысячах добро- вольцев в сотнях экспериментов.
Наконец, с широким развитием так называемых когнитивных исследований в бихевиоризм пришло по- нимание того, что люди совершенно по-разному дума- ют в зависимости от уровня сложности и непривычности ситуаций, в которых они оказываются. Одновременно выяснилось, что реальный человек не похож на класси- ческого рыночного человека, который все выборы осу- ществляет рационально, на основе соизмерения плюсов и минусов, доходов и затрат. Человек, особенно в про- стых, привычных ситуациях, действует в соответствии со стереотипами и сложившимися поведенческими моде- лями, а, отнюдь, не исходя из детальных экономических расчетов. Что же касается сложных ситуаций, то там в основе выбора лежат опять же не расчеты, а прошлый жизненный опыт, ценности и другие трудно считаемые факторы.
В 70-90-е годы поведенческая психология начала активно использоваться в экономических исследовани- ях. Появилась так называемая поведенческая экономи- ка. Сегодня это одно из главных направлений не только теоретической мысли, но и политике на государствен- ном уровне, принимаемых решений в частном секторе. Одним из первопроходцев применения поведенческой экономики к финансам стал Джордж Сорос. В теорети- ческом плане за достижения в области поведенческой

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

экономики Нобелевские премии получили Д. Канеман, Дж. Акерлоф и в 2013 году – Р. Шиллер.
Было бы удивительным, если бы поведенческая эко- номика, ставшая мейнстримом в маркетинге, рекламе, в финансовом и инвестиционном анализе и т.п. не при- шла бы в политику. Решающий шаг в создании поведен- ческой политики был сделан двумя американскими про- фессорами, Кассом Санстейном и Ричардом Талером. В 2009 году они опубликовали книгу «Подталкивание: как улучшить решения, касающиеся здоровья, достатка и счастья» (Thaler, Sunstein. Nudge: Improving Decisions About Health, Wealth and Happiness).
Ключевое понятие книги, вынесенное в ее заголо- вок, – «подталкивание» («Надж») – практически мгно- венно вошло в лексикон политиков, юристов, психоло- гов, бизнесменов и т.п. Его стали использовать как для обозначения поведенческой политики, так и сформиро- вавшегося на его основе нормативного подхода к госу- дарственному регулированию. Смысл нормативного под- хода, сформулированного в книге-манифесте, достаточно прост: «Мы знаем, как сделать вашу жизнь счастливее».
Крайне примечательным является то обстоятель- ство, что авторами книги были не рядовые американ- ские профессора, а ключевые люди из окружений Барака Обамы и Дэвида Камерона. После опубликования книги К. Санстейн весь первый президентский срок Б. Обамы являлся ключевым лицом в его администрации, а в ходе второго срока был назначен в комиссию по реформе АНБ, состоящую всего из пяти человек. Что же касается Р. Талера, то с 2010 года он является советником премьер- министра Великобритании Д. Камерона.
Что же за магическая технология, этот «Надж»? Он является своего рода квинтэссенцией поведенческой политики, или как ее называют в Америке «нового па- тернализма». В ее основе лежит тривиальная мысль, что человек – не робот и решения принимает не на основе

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

соизмерения затрат и результатов, а под воздействием многих факторов, включая эмоции, настроения, привыч- ки и т.п. Однако К. Санстейн и Р. Талер не остановились на азах поведенческой экономики, а интегрировали их с другими научными и технологическими достижениями. Прежде всего, они обратились к достижениям ней- ропсихологии. Нейропсихологам хорошо известно, что масса мозга составляет примерно 2% от массы тела. Од- нако он потребляет в спокойном состоянии до 10% всей энергии организма. Это происходит, когда человек без- думно серфит в интернете, пьет кофе или болтает с дру-
зьями.
Когда человеку необходимо решить задачу, которая требует размышлений, мозг потребляет до 25% энергии. А если стоит не обычная задача, а сложная проблема, то расход энергии увеличивается до 35%. Строго говоря, ду- мать – это очень энергозатратное, и с точки зрения био- логического функционирования, зачастую неоправдан- ное занятие.
Поэтому подчас желаемым состоянием человека является лень. И лишь при необходимости он вынужден действовать, а уж тем более, напряженно думать. Одна- ко жизнь устроена так, что думать человеку приходит- ся практически всегда. Чтобы разрешить противоречие между энергетически выгодной ленью и необходимостью мыслить для того, чтобы существовать, а иногда и выжи- вать, человек вооружается привычками, стереотипами, шаблонами действий, поведенческими паттернами и про- чими автопилотами. Как говорится, живет «на автомате». Но, живя «на автомате», человек стремится к удо- влетворению своих главных потребностей и получению удовольствий. Поэтому поведенческие стереотипы каж- дого человека формируются так, чтобы как можно чаще получать удовольствия, и как можно реже сталкиваться с неприятностями и опасностями, а также необходимо-
стью решать сложные проблемы.

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

К. Санстейн и Р. Талер не ограничились при построе- нии своего метода исключительно достижениями психо- логии и нейронаук. Как раз к моменту написания их кни- ги начался бум Больших Данных. При этом быстро стало понятно, что Большие Данные тем Больше, чем больше характеристик того или иного объекта, субъекта и т.п. они охватывают, чем больше параметров, характеристик содержится в Данных, и чем чаще эти Данные собира- ются.
Сегодня в Америке имеется несколько провайде- ров данных о людях, социальных группах и компаниях. Крупнейший из них, Аcxiom имеет полный набор данных более чем на 500 млн. человек, включая большинство взрослых американцев и жителей других стран. Общее число параметров цифровой личности каждого челове- ка, включенного в базу компании, в среднем составляет в США около 50.
Однако, самый большой провайдер данных – это американское правительство. Официально это – финан- совые, налоговые службы, системы медицинского стра- хования и т.п. В имеющихся у государства и крупнейших частных провайдеров данных содержится практически все. От номеров социального страхования и водитель- ского удостоверения до историй болезни и взаимоот- ношений с кредитными учреждениями. От девичьей фамилии матери до перечня мелких административных правонарушений. Третьей составляющей технологии К. Санстейна и Р. Талера стало использование Больших Данных в виде поведенческого архива, т.е. интернета. Как сказал уже упоминавшийся автор триллеров Майкл Маршалл Смит: «Цифровые следы, в отличие от следов на земле, остаются навечно».
Фактически интернет, помимо многого другого, является еще и всеобъемлющим цифровым поведен- ческим архивом, в котором зафиксирована активность людей в Сети за многие годы. При этом в архиве содер-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

жатся данные как о практических действиях, включая различного рода поездки, покупки, обращения к врачам и т.п., так и мысли в виде текстов и, наконец, даже на- мерения и эмоции, материализованные в коротких за- писях в социальных сетях, в текстах электронных писем и т.п. Этот архив имеет распределенную архитектуру. Его составные блоки имеются у поисковиков, у владельцев социальных сетей, в крупнейших интернет-магазинах, интернет-сервисах и, конечно же, у структур американ- ского правительства, прежде всего, в АНБ.
Наличие огромного всеобъемлющего поведенче- ского архива позволило компаниям – владельцам Боль- ших Данных использовать их для предсказания поведе- ния. Проиллюстрируем это широко известной в Америке историей. Однажды в магазин крупнейшей торговой сети Target зашел мужчина и потребовал вызвать менеджера. В своих руках он сжимал огромную кипу купонов магази- на, полученных его дочерью.
«Моя дочь получила это по почте! – прокричал он. – Она еще в школу ходит, а вы посылаете ей купоны на детскую одежду и памперсы? Да как вы смеете! Вы хоти- те таким способом побудить школьниц рожать?»
Менеджер посмотрел на пачку купонов на
мате- ринскую
одежду,
детскую мебель – действительно,
они
были
адресованы
дочери
рассерженного
мужчины.
Ме-
неджер
принес
свои
извинения.
Через несколько дней он позвонил мужчине, что- бы еще раз извиниться. По телефону голос отца звучал растерянно. «Знаете, я серьезно поговорил с дочерью, и выяснилось, что в моем доме происходило то, о чем я совершенно не догадывался. Она рожает в августе. При- мите мои извинения».
Поэтому Target поставил перед отделом прогнозной аналитики задачу: определить, какая из покупательниц ждет ребенка до того, как это станет очевидно. Проана- лизировав покупательские привычки беременных жен-

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

щин, аналитиками была разработана система прогнози- рования беременности.
Представим себе ситуацию: молодая женщина захо- дит в магазин и покупает лосьон с кокосовым маслом, сумку для прогулок и ярко-голубой плед. Программное обеспечение в Target выдаст свой вердикт: вероятность беременности этой покупательницы – 87%. Данные по- ступают маркетологам, и теперь Target начнет формиро- вать ее привычки и управлять ими: пришлет ей купон со скидкой на детскую кроватку, присыпку, детские буты- лочки и т.д. Причем это будет выглядеть ненавязчиво, чтобы не вызвать волну негодования за «шпионаж»: скидки на товары для детей помещаются среди скидок на другие товары.
«Подталкивание» («Надж») представляет собой ис- пользование поведенческих стереотипов, психофизио- логических реакций и Больших Данных для целенаправ- ленной коррекции поведения тех или иных конкретных социальных, имущественных, возрастных и т.п. групп. Для коррекции поведения используется открытый Кур- том Левиным канальный, или тоннельный эффект. Вы- бор тех или иных факторов воздействия, которые обе- спечивают реализацию этого эффекта, осуществляется на основе предсказательной аналитики и Больших Дан- ных. В бизнесе это используется для увеличения продаж. А в политике, например, для прямого воздействия на электоральное поведение, как во время последних пре- зидентских выборов в США.
Прежде чем применить свою технологию на госу- дарственном уровне, К. Санстейн и Р. Талер опробовали ее в экспериментальном порядке. Известно, что чипсы, булочки и шоколадки вредны для растущего детского ор- ганизма. Также не секрет, что, в общем и целом, школь- ники скорее возьмут на обед пакет вредных чипсов, чем полезный овощной салат. И любые прямые запреты ока- жутся недейственными, и будут обойдены. Между тем,

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

известно, что выбор потребителей зависит от того, как расположены продукты на полках магазина. Попробуйте заставить школьников есть фрукты вместо чипсов. Не- возможно? Можно. Главное, правильно использовать лень и поведенческие стереотипы.
Так, почему бы не воспользоваться этим обстоятель- ством, и не разложить в школьных кафетериях фрукты и салаты на уровне глаз школьников, а чипсы и булочки – в самых дальних углах, на нижних и верхних полках при- лавков, куда надо нагибаться и подтягиваться. Когда К. Санстейн и Р. Талер провели массовые эксперименты в школах Вашингтона, Нового Орлеана, Сиэтла и Колам- буса, оказалось, что в поединке между ленью и вожде- лением в значительном числе случаев победила лень. В течение трех месяцев более половины школьников отка- зались от чипсов, и перешли на салаты, фрукты и другое полезное питание.
Затем работа была перенесена в онлайн. Р. Талер стал консультантом британского правительства и при помощи «подталкивания» вывел из тупика застопорив- шуюся пенсионную реформу в стране. Великобритания, подобно другим странам, столкнулась с растущим дефи- цитом в пенсионной системе и была вынуждена перей- ти к накопительной системе начисления пенсий. Однако, получив свободу выбора, значительная часть граждан не стала откладывать на старость, и проблема еще больше обострилась. Тогда по предложению созданной прави- тельством поведенческой команды во главе с Р. Талером, после анализа Больших Данных была сформулирована рекомендация. Суть ее состояла в том, что компании должны автоматически включать работников в накопи- тельную пенсионную схему, предоставив им право при желании отказаться от нее. Англичане решали, какой пенсионный план выбрать, при помощи портала пенси- онной реформы.

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

До рекомендаций Р. Талера человек должен был сначала прочитать длинные рекомендации, написанные не всегда понятным для простого человека языком, а за- тем самостоятельно поставить галочку против выбран- ного варианта. Р. Талер предложил изменить ситуацию. Место рекомендаций заняли короткие, изложенные ясным слогом разъяснения плюсов и минусов каждого варианта, а галочку человек доложен был ставить, если он отказывался от накопительного варианта и выбирал другой из нескольких предложенных. Накопительный вариант стал выбором по умолчанию. Казалось бы, и в первом, и во втором случае за гражданами оставалась свобода выбора. Но с практической реализацией реко- мендаций Р. Талера число граждан, перешедших на на- копительную схему, значительно возросло. Лишний раз подтвердилось, что поведение человека зависит не толь- ко от самой по себе дилеммы выбора, а и оттого, как она формулируется и в каких условиях реализуется.
Летом 2013 года объявлено, что команды по ис- пользованию «Надж» создаются в большинстве мини- стерств США, связанных с социальными вопросами. На них возложена задача «подталкивания» американцев к правильным с точки зрения правительства решениям не на основе объяснений, а путем использования поведен- ческих стереотипов, привычек и психофизиологических реакций. При этом американские СМИ высказали подо- зрение, что команды «Надж» создаются и в других, в том числе, разведывательных ведомствах. Однако их финан- сирование реализуется через секретные статьи бюдже- та, и поэтому их существование не афишируется.
Профессионалы «Надж», развивая поведенческую политику, исходят из нескольких основных принципов:
Для решения своих поведенческих проблем люди нуждаются во вмешательстве третьих лиц. Наилучшим кандидатом на эту роль является государство.

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

Эксперты, изучая то влияние, которое в реальной жизни оказывают на благосостояние те или иные акты выбора, принимают от имени индивидов решения луч- ше тех, на которые индивиды способны сами.
Любые стимулирующие схемы, которые возла- гают на людей ответственность за последствия их про- шлых действий, неэффективны. Вместо них необходи- мы схемы, которые немедленно вознаграждают или наказывают людей за будущие последствия их текущих действий – последствия, которые сами они неспособны осознать и учесть.
С точки зрения политики то, как люди ощущают себя в обществе, важнее того, что они желают, или того, что они делают.
Фактически, сегодня в Великобритании и США реа- лизуется концепция подлинного Большого Брата. На уровне государственной политики реализуется принцип: правительство лучше знает, что хорошо, а что плохо для людей, и поэтому вправе незаметно подталкивать их к тем решениям, которые оно считает правильными. Клю- чевую роль в этой технологии играют Большие Данные. Именно Большие Данные позволяют как угодно, в зави- симости от поставленной задачи проводить классифика- цию групп и ситуаций, осуществлять анализ и прогноз, а главное, искать тоннельные или канальные факторы, обеспечивающие нужное поведение целевых групп в конкретных ситуациях. И, наконец, в режиме онлайн от- слеживать эффективность подталкивания.
В отличие от многих других технологий, «Надж» не слишком широко рекламируется. Можно говорить о том, что правительства стараются сохранить полную монополию на эту технологию, не допустить ее широко- го распространения в коммерческом секторе. Б. Обама как-то даже назвал группу специалистов по «Надж», под- готовленную К. Санстейном, бихевиористской командой мечты, способной решать важнейшие государственные

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

задачи. Кстати, эта команда сыграла заметную роль во второй президентской кампании Б. Обамы на выборах 2012 года.
Следует подчеркнуть, что в ходе практического при- менения технологии «подталкивания», как в Велико- британии, так и в США осуществлялась не выборочное, а практически поголовное наблюдение при помощи са- мого изощренного интернет-инструментария, насколько применение «Надж» осознается населением. Выясни- лось, что действие этой технологии практически не осо- знается.
Стоит отметить, что при наличии соответствующих Больших Данных нет никаких ограничений для исполь- зования технологии «Надж» не только в отношении граждан собственной страны, но и населения любых государств мира. При наличии соответствующих Боль- ших Данных «Надж» может рассматриваться как сверх- эффективное информационно-психологическое ору- жие следующего поколения. Хотя, с учетом принципов и технологий, на которых построена система «Надж», более точным является не привычное наименование информационно-психологического оружия, а скорее от- несение технологии «подталкивания» к поведенческому оружию, базирующемуся на Больших Данных, достиже- ниях объективной психологии и нейронауках.

 

.5. О чем умолчал Э. Сноуден
В любой спецоперации все прямо и косвенно причастные акторы стремятся реализовать собственные цели. Не является исключением и эпопея Э. Сноудена. Вполне очевидно, что Э. Сноуден хотел раскрыть глаза американскому и мировому общественному мнению на незаконные методы деятельности АНБ, тотальную слеж- ку и прослушку. В то же время нельзя не отметить, что большая часть разоблачений Э. Сноудена, при всей их сенсационности, не открыла чего-то нового для экспер-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

тов и специалистов в сфере разведки. Практически все, о чем поведал Э. Сноуден, было известно до него. Хотя и без деталей, подробностей, названий конкретных про- грамм, размеров ассигнованных сумм и т.п. Конечно же, эти детали перевели предположения экспертов из раз- ряда гипотез в сферу конкретных фактов и документиро- ванных мнений.
Однако интересно посмотреть, каких разделов кос- нулись разоблачения Э. Сноудена. В основном речь шла о нарушении приватности не только иностранцев, но и граждан США, прослушивании телефонных разговоров не только рядовых американцев, но и глав стран – союз- ников США, контроле со стороны АНБ за финансовыми транзакциями, осуществляемым по самым разнообраз- ным потокам, программам развития кибервооружений и т.п. Все это произвело чрезвычайно большое впечатле- ние и имеет до сих пор серьезные последствия как для престижа США, так и для межгосударственных отноше- ний. Несомненно, это сказалось и на доходах компаний, упомянутых в разоблачениях Э. Сноудена.
Тем не менее, есть устойчивое впечатление, что АНБ использовало эпопею Э. Сноудена, уж коль скоро она произошла, как стандартную операцию прикрытия в от- ношении действительно главной, до сих пор тщательно скрываемой задачи, решаемой Агентством Националь- ной Безопасности и другими государственными структу- рами США при его содействии. Речь идет о разработке и практическом использовании технологий управления групповым и массовым поведением в других странах мира, как в странах-союзниках, так и противниках Соеди- ненных Штатов Америки.
Нетрудно заметить, что в материалах Э. Сноудена во- обще не содержится информация на эту тему и соответ- ственно может возникнуть предположение, что тезис об управлении групповым поведением сколь угодно боль- шой размерности имеет отношение не к фактическому

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

положению дел, а к конспирологии. Причем, конспиро- логии, понимаемой не в смысле научного, фактологиче- ского расследования, а в традиционной трактовке, как измышления незрелого ума и порождения неустойчи- вой психики.
На сегодняшний день существует достаточно боль- шое количество имеющихся в открытой печати, а также в специализированных публикациях данных и фактов, подтверждающих высказанный выше тезис о переходе США к скрытому управлению поведением.
Первое. Начать, несомненно, надо с наиболее на- глядного, что называется материализованного свиде- тельства практической постановки задачи управления поведением. Речь идет о только что отстроенном, осна- щенном и выводимом на расчетную мощность циклопи- ческом центре АНБ в штате Юта. Понятно, что для целей шпионажа, радиоэлектронной разведки, криптографии и проч. требуется гигантский объем хранилищ данных. Однако, для них не нужно хранилище объемом в один йоттабайт, которое расположено в новом Дата-центре в штате Юта. Чтобы наглядно понять, о чем идет речь, отметим, что весь ежегодный интернет-трафик, включая собственно интернет, интернет вещей и проч. приближа- ется в настоящее время к одному зеттабайту. Тем самым в Юте имеется хранилище для 100-летнего мирового интернет-трафика. Однако размерность сразу умень- шается в том случае, если не просто хранить трафик, т.е. данные всех типов, а обрабатывать их различными способами, для чего представлять данные в виде самых различных классификаций. Иными словами, не для чего иного, как для интеллектуального анализа сверхбольших объемов данных такое хранилище просто не нужно.
Второе. В США, в отличие от других стран, еще в 1994 г. была создана специальная широкополосная сеть для совместного межведомственного использования ре- сурсов (аппаратных и программных) суперкомпьютеров.

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

Фактически в Соединенных Штатах в отличие от других стран суперкомпьютерная сеть не разделена ведом- ственными и корпоративными барьерами, а функциони- рует как единое целое. Более того, в начале нулевых го- дов американцы договорились с Великобританией, что к этой сети подключаются и британские суперкомпьютеры. Это весьма важно, поскольку согласно международным оценкам, лидером по эффективности использования су- перкомпьютеров в секретных проектах выступает имен- но Великобритания. Данных по этой сети нигде нет, но различного рода косвенные расчеты позволяют утверж- дать, что мощность этой сети составит от половины, до двух третей суммарной мощности всех 500 суперком- пьютеров, входящих в настоящее время в мировой рей- тинг. Наиболее мощные суперкомпьютеры, входящие в сеть, принадлежат АНБ, Министерству энергетики США, британской разведке и американским университетам, тесно работающим с военно-разведывательным ком- плексом. С 2014 года общее руководство сети осущест- вляет Киберкомандование США.
Третье. За последние четыре года Соединенные Штаты истратили несколько сот миллионов долларов на разработку программ интеллектуального анализа не просто Больших, а сверхбольших массивов данных. При- мечательно следующее обстоятельство. В коммерче- ском секторе для анализа Больших Данных в основном используются методы математической статистики. В то же время, анализируя гранты таких агентств, как DARPA и IARPA, можно увидеть, что средства затрачивались на разработку программ по анализу и прогнозированию на основе Больших Данных, базирующихся на принци- пиально новых разделах математики, типа теории кате- горий и функторов, на системах распознавания образов, нейронных вычислениях и так называемом глубоком машинном обучении. Все эти методы на порядки пре- восходят с точки зрения выявления нетривиальных за-

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

висимостей и связей, мощности и точности прогнозиро- вания, методы стандартной математической статистики, которые описываются как основной инструмент во всей специализированной литературе по Большим Данным.
Четвертое. Последние годы в США предпринимают- ся организационные и законодательные меры по обе- спечению потребностей разведсообщества Большими Данными. Прежде всего, следует иметь в виду, что само по себе Агентство Национальной Безопасности является обладателем крупнейших массивов Больших Данных, которые оно получает в результате своей шпионской де- ятельности, о которой мир сегодня неплохо осведомлен благодаря разоблачениям Э. Сноудена.
Гораздо менее известна организация FSD. В перево- де на русский она может быть названа Службой Феде- ральных Данных. Главным ее назначением является кон- центрация данных об американцах, которые собирают практически все федеральные ведомства, министерства, агентства и т.п. Без преувеличения можно сказать, что не в одной стране мира нет такой подробной базы данных на своих граждан, как в Соединенных Штатах, и содер- жится эта база не в АНБ, а в неприметной организации с указанным выше названием. При этом надо иметь в виду, что в данную организацию дополнительно стека- ются все данные из страховых компаний, банков, пенси- онных фондов, авиакомпаний и т.п. под американской юрисдикцией. Соответственно, если те или иные люди застрахованы в американской компании, обслуживают- ся американскими банками или банками, имеющими корреспондентские счета в американских банках, лета- ли американскими авиалиниями или используют аме- риканские кредитные карты, типа Visa, American Express и т.д., то все их данных также попадают в эту организа- цию, а оттуда – в Центр Больших Данных АНБ.
Э. Сноуден не просто рассказал, а даже показал на слайдах связь с АНБ крупнейших интернет-компаний

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

и телекоммуникационных гигантов. В результате прои- зошел большой скандал. Компании сначала протесто- вали, затем сообщили, что вносят соответствующие тре- бования в Конгресс США о том, чтобы прекратить прак- тику использования их данных в интересах АНБ. Однако от публики, и даже большинства экспертов укрылось крайне важное обстоятельство. Речь в протестах идет о персональных данных, т.е. данных, по которым можно идентифицировать пользователя как Ивана Ивановича Иванова, либо Джона Смита Третьего и т.п.
Большие же Данные – это не персональные данные. В принципе, персональные данные могут быть Больши- ми Данными, а могут и не быть. Более того, для техно- логий Больших Данных сама по себе идентификация конкретного человека не важна и не интересна, потому что связи и закономерности, выявляемые при помощи Больших Данных, имеют статистический характер, а не касаются судьбы конкретного индивидуума. Про Боль- шие Данные речь в разоблачениях Э. Сноудена вообще не шла.
Практически все крупнейшие провайдеры Боль- ших Данных, а ими являются Google, Facebook, Twitter, Amazon, eBay и т.п., имеют американскую юрисдикцию. Между тем, в антитеррористическом законе США, име- нуемом как «Акт 2001 года, сплачивающий и укрепляю- щий Америку обеспечением надлежащими орудиями, требуемыми для пресечения терроризма и воспре- пятствования ему» и Указе №13603 от 16 марта 2012 г. подписанном Президентом Б. Обамой, озаглавленном
«О готовности ресурсов национальной обороны» четко прописаны обязанности американских компаний с точки зрения национальной обороны.
В число этих обязанностей входит предоставление данных, потребных для выполнения задач националь- ной обороны. Известно, что Большие Данные подпадают под юрисдикцию этих указов. Причем, если в отношении

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

персональных данных вообще и американцев в частно- сти предусмотрены некоторые ограничения, связанные с необходимостью решений Секретного Суда для полу- чения таких данных, то Большие обезличенные Данные должны предоставляться что называется в рабочем по- рядке по требованию.
Важно, что такие данные должны предоставлять не только американские компании – провайдеры Больших Данных, либо брокеры данных, но и компании, которые котируются на американском биржевом рынке. Послед- ние два обстоятельства нуждаются в некотором поясне- нии. В Соединенных Штатах существует целый ряд круп- нейших компаний, которые покупают данные по всему миру у других, как правило, у торговых компаний и пере- продают их транснациональным корпорациям для целе- вого, или как его еще называют таргетированного марке- тинга, и т.п. В их числе Acxiom, Experian, Epsilon и т.п.
Кроме того, практически все крупные международ- ные интернет-компании котируются на NYSE, либо на Nasdaq. Соответственно, и эти компании при получении запроса под угрозой лишения листинга также должны передавать обезличенные Большие Данные американ- скому правительству, а иными словами АНБ. При этом то, что они могут иметь иную юрисдикцию и действовать в далеких от Америки регионах, не является препятстви- ем для этих обязательств.
Подытоживая можно сказать, что АНБ сегодня име- ет доступ к подавляющему большинству Больших Дан- ных, имеющихся в мире. Некоторые высказывают точку зрения, что исключением является Китай. Однако другая часть специалистов не без основания полагает, что и ки- тайские Большие Данные в немалой степени оказыва- ются в США через американских и британских брокеров данных.
Пятое. В течение последних полутора лет в Соеди- ненных Штатах прошел целый ряд научных конферен-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

ций, круглых столов и заседаний, инициированных теми или иными «думающими танками», среди кото- рых выделяется Институт сложности в Санта-Фе. В этих мероприятиях участвовали ведущие исследователи и разработчики в сфере Больших Данных, руководители департаментов поведенческого маркетинга и таргетиро- ванной рекламы, специалисты в сфере прогнозирования на основе Больших Данных – с одной стороны, и высо- копоставленные правительственные чиновники, пред- ставители разведывательного сообщества и члены бри- танской и американской правительственных программ
«Надж» – с другой. Например, на одной из такого рода конференций с основным докладом Strategic potential of big data for National Security выступила исполнительный директор IARPA Катарина Марш.
Как правило, в большинстве такого рода мероприя- тий принимали участие один из ближайших советни- ков Б. Обамы, участник группы по реформе АНБ Касс Санстейн, Ричард Талер, его соавтор по книге «Надж» и Алекс Пентланд. Алекс Пентланд недавно включен жур- налом «Форбс» в число семи самых влиятельных иссле- дователей в области информационных технологий. Он руководит несколькими лабораториями в знаменитом МТИ, входит в число советников нескольких компаний из списка Форчун-500, консультирует правительство США.
Чтобы понять, о чем шла речь на этих мероприятиях, достаточно процитировать одну из статей Алекса Пент- ланда. «Я уверен, что значение Больших Данных состоит в том, что они дают информацию о поведении людей, а не об их убеждениях... Понятие Больших Данных и наука о сетях находятся за гранью обычных подходов к про- ектированию социальных структур... Адам Смит и Карл Маркс ошибались, или, по меньшей мере, предлагали только половинчатые решения. Почему? Потому что они строили свои теории на основе усредненных понятий рынка и классов. И хотя, безусловно, рассуждение в таких

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

терминах тоже может быть полезным, однако очевидно, что социальные феномены на деле состоят из миллио- нов мелких транзакций между индивидами. Существуют отдельные примеры межличностных взаимодействий, которые не просто не укладываются в усредненные па- раметры, а являются причиной социальных вспышек и потрясений, таких как Арабская весна. Придется снизой- ти до этих мельчайших примеров, этих микропримеров, потому что они позволяют понять социальное устройство вне усредненных показателей. Мы вступаем в новую эру социальной физики, где решающий исход будет зависеть от самых мелких деталей, от таких мелочей, как ты да я... Сам факт того, что мы теперь сможем отслеживать дина- мику социальных взаимодействий и их происхождение, что мы больше не будем ограничены усредненными показателями, такими как рыночные индексы, вызыва- ет во мне трепет. Мы будем способны предсказывать и управлять поведением рынков и возникновением рево- люций».
На этих конференциях родился пока еще не полу- чивший широкого признания термин hidden power, или
«невидимая сила».
Вполне очевидно, что представленные факты
но-
сят комплиментарный,
т.е.
дополняющий друг
друга
характер и показывают целостную картину
завершаю-
щего этапа создания технологической системы
управ-
ления групповым и массовым поведением любой
раз-
мерности в иностранных государствах для
реализации
интересов США или наднациональной
финансово-
корпоратократической
элиты.
Итогом такого управления должно стать превра- щение субъектов мировой политики, экономики и т.п. в объекты, находящиеся под внешним, невосприни- маемым руководящим воздействием. Для того, чтобы этого не случилось, необходимо в крайне сжатые сроки осуществить комплекс весьма интеллектуалоемких, вы-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

сокотехнологичных мер, подкрепленных целым рядом обеспечивающих мероприятий, требующих затрат ре- сурсов и принятия новых юридических актов на государ- ственном уровне.

 

.6. Большие Данные в России: императивы ситуации
В течение последнего года практически ежеме- сячно, а то и чаще в стране проводятся различного рода конференции по Большим Данным. О чем же идет речь на подобных конференциях? Так на Global Entrepreneurship Congress 2014 «Большие возможности Больших Данных», как сообщают электронные СМИ «участники дискуссии привели многочисленные примеры использования тех- нологий Big Data и связанной с этим серьезной экономии средств компаний. Среди таких примеров – система ана- лиза поведения оборудования самолетов, предсказание сбоев и поломок и упредительная замена изношенных частей в аэропорту, в который направляется конкретное воздушное судно; анализ открытых спутниковых данных для оптимального планирования парковок; управление показами рекламных баннеров на сайте в зависимости от того, какую именно покупку совершает пользователь с помощью своей кредитной карты; сервис, информи- рующий автовладельцев о планах городских властей произвести ремонт или уборку улицы в том месте, где они оставили припаркованный автомобиль; прогнози- рование спроса на отдельные наименования товаров и управление складами онлайн-магазинов; использова- ние беспилотных аппаратов для сбора информации о состоянии линий электропередач в отдаленных районах, которое приводит к исключению ненужных дальних по- ездок сервисных бригад; наконец, использование сен- соров на лопастях ветряных мельниц, данные с которых помогают спрогнозировать, откуда именно поступит электроэнергия в следующую минуту (поскольку цены на

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

электроэнергию на глобальном рынке меняются ежеми- нутно, экономия измеряется миллионами долларов».
Конечно обсуждение «ветряных мельниц» и ре- кламных баннеров на сайтах впечатляет, но куда важнее следующие обстоятельства:
во-первых, на всех подобных конференциях речь идет о Больших Данных в их вчерашнем, а то и позавче- рашнем понимании. Большие Данные, как правило, свя- зываются исключительно с бизнес-аналитикой и с воз- растанием объемов, многообразия и скорости передачи данных. Так понимали Большие Данные в США, Европе, Японии три-пять лет назад, когда собственно и появился этот термин;
во-вторых, на конференциях рассуждают, как пра- вило, о будущем времени. По мнению большинства участников, например, одного из руководителей ком- пании Форс – Центра внедрения Oracle О. Горчинской,
«Практически нет проблем с наличием и доступностью технологий Больших Данных, готовностью поставщиков и интеграторов к их внедрению. Но в большинстве своем российские организации пока еще только присматрива- ются к таким решениям»;
в-третьих, ключевыми докладчиками, а то и органи- заторами таких конференций выступают, прежде всего, зарубежные компании, в первую очередь IBM, Oracle, SAP и т.п. Безусловно, взаимовыгодное, многосторон- нее сотрудничество с транснациональными гигантами IT-индустрии весьма полезно и выгодно как для россий- ской экономики, так и для российских разработчиков. Углубление такого сотрудничества соответствует инте- ресам бизнеса, способствует оптимальному углублению разделения труда в IT-сфере в глобальном масштабе.
Однако, в нынешней непростой геополитической обстановке нельзя закрывать глаза на одно неочевид- ное обстоятельство. Сегодня все зарубежные СМИ пол- ны аналитическими статьями об использовании Росси-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

ей энергетических ресурсов в качестве своеобразного геополитического оружия и средства достижения на- циональных целей. В этой связи вполне закономерно и логично предположить, что США, являющиеся бесспор- ными лидерами в сфере информационных технологий, также рассматривают их как своего рода технологиче- ское оружие и средство научно-технического, экономи- ческого и геополитического давления.
Зарубежные специалисты полагают, что рынок в сфере Больших Данных в России достаточно ограничен с точки зрения готовности российских потребителей к использованию кластера этих технологий. Однако пред- ставляется, что подобная ограниченность не является единственной причиной повестки дня конференций. Другая, непроговариваемая причина состоит в том, что, по сути, зарубежные производители программных про- дуктов, связанных с Большими Данными, навязывают российскому рынку своего рода «консервирующую ди- намику». Эта динамика закрепляет отставание россий- ской экономики вообще, и IT-отрасли в частности от зарубежных конкурентов и поддерживает господство зарубежных производителей на этом стратегическом сегменте IT-рынка.
Любой профессионал в сфере Больших Данных на вопрос, какие темы сегодня обсуждаются на конферен- циях по Большим Данным за рубежом, ответит, что там речь идет, в первую очередь, о так называемой «пред- сказательной» аналитике, поведенческом маркетинге на основе Больших Данных, экспертных системах, базирую- щихся на когнитивных вычислениях Больших Данных и т.п. Ни о чем подобном в практическом плане на россий- ских конференциях, организованных транснациональ- ными IT-компаниями, речи не ведется.
Как же быть в сложившейся ситуации?
Представляется, что начинать сегодня наверстывать упущенное и повторять уже пройденный путь вряд ли це-

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

лесообразно. В подобном случае российский IT-сегмент Больших Данных, обслуживающий, в том числе, не толь- ко интересы бизнеса, но и государственного управления, включая вопросы национальной безопасности, окажется вечно отстающем. Видимо, есть смысл сразу задумать- ся о реализации решений завтрашнего дня. Тем более, предпосылки в виде отечественной математической и программистской школ, кадрового потенциала, финан- совых ресурсов и т.п. в нашей стране имеется.
Что же будет выступать завтрашним днем Больших Данных? Чтобы ответить на этот вопрос, необходимо внимательно присмотреться к наиболее динамично раз- вивающимся направлениям сегодняшнего дня. Среди них выделяются:
• Третья производственная революция с массовой роботизацией, автоматизацией производства, внедрени- ем 3D-печати, базирующаяся на информационных техно- логиях и Больших Данных, как на несущей конструкции;
• повсеместное распространение «интернета ве- щей» и ускоренный переход от «интернета вещей» к
«интернету всего». «Интернет всего» предполагает, что к всемирной сети будут подключены практически все устройства, предметы и инфраструктуры во всех сферах жизнедеятельности социума и отдельного человека;
• широкое распространение автоматизирован- ных систем поддержки и принятия решений на основе Больших Данных. Наиболее значительным прорывом в этой сфере на сегодняшний день стали системы высоко- частотного, полностью роботизированного трейдинга. Ежедневно эти системы при минимальном участии че- ловека или без оного, осуществляют торговые сделки, измеряемые сотнями миллиардов долларов. Ширится мнение, что на высокочастотном трейдинге отрабаты- ваются человеко-машинные и автоматизированные си- стемы принятия решений для сложных и сверхсложных систем.

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

Все три магистральных направления развития ин- формационных технологий ведут к появлению в бли- жайшем будущем распределенных самообучающихся систем когнитивных вычислений. Поясним, о чем идет речь на самом простом примере. Всем хорошо извест- но, что Google активнейшим образом развивает про- грамму полностью автоматизированных автомобилей, способных к нормальной эксплуатации в напряженной городской среде. В рамках этой программы реализует- ся следующий важнейший принцип. Каждый автомо- биль снабжен как автономным бортовым компьютером со встроенной программой машинного обучения, так и подключением к общей базе сверхбольших Данных для всех эксплуатируемых автомобилей. Т.е. на каждой до- рожной ситуации, на каждом ЧП, в которое попадает машина, программа учится, находит имеющиеся в ней ошибки, устраняет их с тем, чтобы в последующем не попадать в подобные ситуации. В этом смысле машина, пускай грубо, но имитирует принцип жизнедеятельности человека, который, как известно, учится на собственных ошибках. Одновременно программа сообщает о найден- ной ошибке, ее решении в общую распределенную базу сверхбольших Данных, к которой подключены все авто- мобили. Тем самым, каждая машина учится не только на собственных ошибках, но и на ошибках, которые совер- шаются другими автомобилями. Более того, найденное программой одного автомобиля удачное программное решение становится достоянием всех. Фактически мы имеем дело со своего рода стаей, соединенной тесными связями взаимного обучения. Применительно к произ- водственным роботам подобная программа сейчас реа- лизуется в Германии. К роботам, занимающимся убор- кой домов – в Японии.
О чем это все говорит? Мы видим, что повсемест- но Большие Данные используются для коллективного обучения и выработки все более эффективных решений.

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

Фактически это, по сути, является имитацией памяти и логического мышления. Ведь память тоже аккумулиру- ет знания о прошлом, о том, что удалось и не удалось, закрепляет удачные образцы, которые в дальнейшем и используются в поведении и, как открыл П. Анохин, в опережающем реагировании на изменения внешней среды.
Сначала человек использовал только возможности своего физического тела и соответственно своей пси- хофизиологической памяти. Всем хорошо известно, что помнит человек практически все, но вот использовать все, что находится в памяти, не может по многим при- чинам.
В дальнейшем, с появлением развитых языков и письменности, человек, по сути, выстроил вторую, коллективную память, где фиксировались индивидуаль- ные и групповые успехи и неудачи, к которым мог иметь доступ любой участник социума. В этом смысле тексты, фильмы, аудиозаписи и т.п. представляют собой память
«второго рода».
Несложно заметить, что Большие Данные есть не что иное, как память «третьего рода», ориентированная на эксплуатацию человеко-машинными системами. Эта память имеет распределенный характер, в ней ничего не забывается, к ней постоянно открыт доступ, она ис- пользуется в режиме 24/7 и построена так, чтобы быть удобной для применения мощнейших средств интеллек- туального, прежде всего, математического анализа. На- конец, мощность этой памяти и возможность обработки хранящейся в ней информации при помощи самых раз- личных методов значительно превышает мощность лю- бого индивидуального интеллекта.
В этом смысле создание действующих систем хране- ния, обработки и восприятия Больших Данных, как па- мяти «третьего рода» является прорывом, сравнимым с появлением самих по себе компьютеров, а также дру-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

гих эпохальных технических решений. При этом в дан- ном случае речь идет не только о чисто техническом, но о социотехническом решении, которое затрагивает все стороны практической жизни людей. Также понятно, что создание и эксплуатация памяти «третьего рода» стано- вится одним из решающих преимуществ, обеспечиваю- щих ее обладателям доминирование в любых сферах жизнедеятельности.
В этой связи с особой остротой встает тема, которую в течение последнего года активнейшим образом разра- батывает один из самых известных людей в российской IT-индустрии Игорь Ашманов. Это тема информационно- го суверенитета.
Информационный суверенитет – это «возможность государства управлять информацией». Информацион- ный, или цифровой суверенитет, как справедливо от- мечает И. Ашманов, включает несколько компонентов. Это и техническая инфраструктура, и программные про- дукты, и собственные поисковые системы, и социальные сети и т.п.
В ближайшем будущем несущей конструкцией и ключевым ресурсом, определяющим цифровой суве- ренитет, становятся Большие Данные, как «третий вид памяти». Именно Большие Данные аккумулируют в себе архивы поисковых систем, социальных сетей, торговых платформ, бизнес- и государственные базы самого раз- личного рода и т.п.
Особо проблема цифрового суверенитета обостря- ется в современном мире. Не секрет, что сегодня проис- ходит не только слом однополярной мировой системы, но и де-факто мир прощается с Потсдамской системой мироустройства. Реальностью становится тот факт, что все большую роль в международных отношениях начи- нает играть не право, а сила.
Собственно, процесс этот начался давно. Наиболее ярко он проявил себя в конце 90-х г. в связи с распадом

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

бывшей Югославии и событиями в Косово. Сегодня же мы являемся свидетелями конца монополии на одно- сторонний демонтаж прежнего миропорядка. Прекрас- но отдавая себе отчет в возрастании значения силового компонента, Соединенные Штаты и их союзники одно- временно не испытывают иллюзий относительно воз- можностей применения наиболее разрушительных ви- дов вооружения. По мнению большинства экспертов ни Соединенные Штаты, ни Западная Европа не технически, не организационно, не, главное, ментально, не готовы к серьезной «горячей» войне.
В этой связи последние 30 лет, прежде всего, в США и Великобритании ведется неустанный поиск новых видов вооружений, которые позволяют реализовать Оруэлли- анскую концепцию: «мир – это война, свобода – это раб- ство». Первыми в ряду этих вооружений были кажущие- ся сегодня простыми информационно-психологические вооружения, базирующиеся на традиционной пропаган- де и достижениях классической психологии. Затем стали использоваться более изощренные технологии програм- мирования деструктивных действий в виде «цветных» революций и т.п.
Не
секрет,
что до сих пор наиболее
обсуждаемы-
ми темами среди российского экспертного
сообщества остаются темы «цветных» революций, так
называемого
«управляемого хаоса» и т.п. Между тем, эти темы все- рьез уже перестали рассматриваться западным военно- разведывательным сообществом как последние, и наи- более совершенные военные технологии. При этом в США, Великобритании и т.п. продолжают активно изда- ваться книги по «цветным» революциям, управляемому хаосу, деструктивным восстаниям и т.п. Проводятся со- ответствующие конференции. Однако ничего принципи- ально нового на них не появляется. Детальный анализ участников конференций и авторов книг, а также кон- структивное рассмотрение их содержания показывает,

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

что последние полтора-два года подобные мероприятия выполняют скорее отвлекающую роль. Фактически есть основания полагать, что эта работа в немалой степени стала элементом большой операции прикрытия и дезин- формации, направленной на отвлечение интеллектуаль- ных усилий цивилизационного противника.
На практике же главные усилия сосредоточены на разработке принципиально нового поколения вооруже- ний, так называемых «поведенческих» вооружений. По- веденческие вооружения базируются на трех китах: во- первых, Больших Данных, как памяти «третьего рода», во-вторых, когнитивных вычислениях, объединяющих мощь математических методов с пусть грубой, но уже имитацией работы человеческого мозга и, в-третьих, ак- кумуляции и использовании достижений поведенческой психологии.
Как показывает анализ видимого и невидимого сег- ментов интернета, подавляющая часть публикаций на эту тему засекречена. Можно найти лишь отдельные фраг- менты, куски работ или исследований, касающихся этих тем, но прямо не связанных с военно-разведывательной тематикой. Тем не менее, недавно появились прямые доказательства разработки, по крайней мере, в США и Великобритании, поведенческих вооружений, ори- ентированных на скрытое управление групповым по- ведением коллективов различной размерности. Так, в конце прошлого года Институт оборонного анализа, финансируемый Пентагоном, разведывательным со- обществом и Государственным Департаментом опу- бликовал документ «Pathways to Cooperation between the Intelligence Community and the Social and Behavioral Science Communities». В нем упоминается, что в 2013 году было проведено большое совещание по програм- ме «Minerva Research Initiative». Это закрытая програм- ма IARPA в области управления групповым поведением на основе Больших Данных, которая получила статус

 

Глава 3 БОЛЬШИЕ ДАННЫЕ

 

стратегической важности с точки зрения национальной безопасности США.
В подготовленном в прошлом году министерством обороны Великобритании докладе «Global Strategic Trends out to 2040» в качестве одной из целей ближнего прицела также выделено скрытое управление группо- вым поведением на основе Больших Данных. Этот до- клад в определенной степени стал осмыслением бри- танского военного бестселлера последнего года, книги бывшего командующего британскими подразделениями в Северной Ирландии, Косово, Ираке, Ливане и Афгани- стане генерал-майора Э. Маккея и коммандера С. Тота- ма «Поведенческий конфликт» (Behavioural Conflict: Why Understanding People and Their Motives Will Prove Decisive in Future Conflict). Выводом книги стали следующие сло- ва: «Наша способность понять и незаметно изменять по- ведение групп людей станет определяющей характери- стикой вооруженных конфликтов нового типа».
Нет сомнений, что в современной сложной геопо- литической ситуации Большие Данные являются стра- тегическим ресурсом и приоритетом не только разви- тия экономики и социума, но и важнейшим вопросом обеспечения национальной безопасности. В этой связи представляется целесообразным:
во-первых, сориентировать Фонд развития интернет- инициатив, Фонд Сколково и Фонд перспективных ис- следований на государственное и негосударственное финансирование стартапов и отечественных разработок в сфере Больших Данных, нацеленных в первую очередь на межотраслевое использование, а также решение за- дач в области охраны правопорядка и решения задач на- циональной безопасности;
во-вторых, организовать в ведущих университетах страны с мощными математическими школами и ка- федрами по программированию, системному анализу, лингвистике и т.п. кафедры Data science (наука о дан-

 

Елена Ларина, Владимир Овчинский
КИБЕРВОЙНЫ XXI ВЕКА. ВОЗМОЖНОСТИ И РИСКИ ДЛЯ РОССИИ

 

ных). В оперативном режиме открыть при кафедрах ма- гистратуры и группы ускоренного обучения Data science и когнитивным вычислениям. Организовать перевод на русский язык имеющихся онлайн видеокурсов по Боль- шим Данным, когнитивным вычислениям и поведенче- скому анализу;
в-третьих, провести научно-практическое совеща- ние по использованию Больших Данных, когнитивных вычислений и поведенческих наук для прогнозирования и противодействию скрытому управлению поведением. В рамах подготовки к совещанию осуществить инвен- таризацию отечественных разработок и имеющихся ка- дров по указанному направлению;
в-четвертых, организовать с привлечением лучших вне зависимости от академических званий и занимае- мых должностей специалистов межотраслевые и вневе- домственные коллективы по разработке методологии, математического аппарата и программных решений по прогнозированию сложных социальных систем и проти- водействию скрытому управлению групповым поведе- нием;
в-пятых, инициировать разработку пакета
норма-
тивных документов, связанных с вопросами
государ-
ственного регулирования Больших Данных, включая
их
сбор,
накопление,
использование
и
возможность
транс-
граничной передачи. При необходимости
проработать
вопрос о
подготовке
государственной концепции в
сфе-
ре Больших
Данных.

 

Назад: Глава 2
Дальше: Глава 4 ПРЕСТУПНОСТЬ ЦИФРОВОГО МИРА

гнпшг
я робот