В качестве примера приведем методы, применявшиеся специалистами из США в отношении Ирана при проведении там президентских выборов в 2009 г. и отраженные в техническом докладе под названием «Использование социальных медиа для оценки иранского общественного мнения и настроений после выборов 2009 года», который готовился несколько лет группой специалистов и был издан только в середине 2012 г.
Сотрудники корпорации RAND использовали метод компьютерного анализа данных и контента в Интернете с помощью программы Linguistic Inquiry and Word Count 2007 (LIWC). Данная программа, позволяющая за считаные секунды проводить анализ тысяч постов в социальных медиа, имеет множество преимуществ. Во-первых, можно проследить, что сказано, кем и какова реакция на эти высказывания через определенное время. Кроме того, можно подсчитать конкретные данные, исключая эффекты, связанные с интерпретацией текста. А при комбинировании автоматического метода с более традиционным, ручным, можно достичь оптимального результата.
Изначально LIWC была разработана для анализа характеристик и закономерностей письменного текста, что позволяет делать выводы о психологическом состоянии людей (например, эмоции или желание, направленное на социальное взаимодействие) на основе использования конкретных категорий слов. LIWC содержит около 80 таких категорий: местоимения первого лица единственного числа, слова, выражающие положительные эмоции, и три примера ругательств.
Для определенного текста LIWC вначале подсчитывает количество слов в тексте. Потом она ищет все слова, содержащиеся в каждой из 80 категорий, сохраняя подсчет количества в каждой категории. Каждый раз, когда LIWC обнаруживает слова в данной категории, она повышает эту категорию на одну позицию. Наконец, LIWC вычисляет отношение количества слов в пределах каждой категории, деленное на общее число слов в тексте.
Такие генерируемые отношения (количественные данные) можно качественно интерпретировать с помощью исследований, связывающих использование определенных слов в конкретных психологических состояниях и поведении. Исходя из этого, путем проверки, например, можно определить, насколько велики коэффициенты или как они меняются с течением времени, можно получить представление о том, насколько широко были распространены неявные настроения среди группы людей, или проверить, как менялось их мнение и настроения.
Следует отметить, что программа LIWC стала своего рода пионером в отслеживании политических процессов в 2009 г. в Иране, так как до этого широкого применения в контексте не западных политических процессов она не получала. Американские специалисты сконцентрировались на Twitter как на наиболее доступном и неподконтрольном правительству Ирана инструменте социального взаимодействия. Период охваченной исследованием политической активности начинался с момента выборов и заканчивался в феврале 2010 г. (рис. 8.1)
Рис 8.1. Пример графика, указывающего на динамику активности иранских граждан в Twitter сразу же после проведения президентской кампании. Источник: Elson, Sara Beth and Douglas Yeung, Parisa Roshan, S. R. Bohandy, Alireza Nader. Using Social Media to Gauge Iranian Public Opinion and Mood After the 2009 Election. Santa Monica: RAND, 2012.
Основной анализ пришелся на 2 675 670 твитов, имеющих тег “IranElection” и отправленных 124 563 людьми с 17 июня 2009 г. по 28 февраля 2010 г.
По мнению экспертов из RAND, им удалось приблизиться к пониманию пяти взаимосвязанных тем:
– что пользователи Twitter говорили о выборах за эти девять месяцев;
– изменялось ли их настроение с начала протестов (это отслеживалось принципиально);
– что они думают о политических лидерах, в том числе Верховном лидере Али Хаменеи, президенте Махмуде Ахмадинежаде, оппозиционных кандидатах в президенты – Мир Хусейне Мусави и Мехди Карруби, а также президенте США Бараке Обаме;
– что и как они писали о некоторых группах, связанных с иранским правительством или оппозицией, в том числе Корпусом стражей исламской революции (КСИР), силами Басидж и оппозиционном Зеленом движении;
– Что они писали о некоторых странах, включая Соединенные Штаты Америки, Израиль и Иран. (рис. 8.2, 8.3)
Рис 8.2. График, указывающий на динамику протестной активности, на основе анализа вирусного распространения высказывания и цитируемости первого сообщения.
Вместе с этим с учетом возможности США и других внешних акторов активно влиять на показатели с помощью ложных аккаунтов становится очевидным, что подобное общественное мнение и показатели могут быть легко манипулируемы и фальсифицируемы извне. Кроме этого, можно провести определенную параллель и с протестным сегментом в России. У нас, как правило, лица, активно использующие мобильные гаджеты и социальные сети, которые являются платформой, где распространяются критические высказывания и откровенно хамские выражения в адрес власти Российской Федерации, вовлечены в оппозиционную деятельность и используют методы, которые позволяют влиять на электоральный ландшафт.
Рис 8.3. Программа позволяет также мониторить вербальное отношение к определенным личностям, что немаловажно при проведении экзитполов и политических прогнозов.
В целом «информационные технологии не только повышают эффективность, но значительно удешевляют и упрощают технологии модификации политического менталитета в широком диапазоне полиментальности. В отличие от традиционного маркетинга, они приспосабливают не товар к предпочтениям людей, а напротив, людей – к уже имеющемуся товару». Данный тезис предполагает, что в качестве товара может быть некий идеологический или политический продукт, навязываемый гражданскому населению извне. Реклама избирательной кампании, программа оппозиционной партии или даже план действий против действующей власти может быть внедрен в сознание граждан Российской Федерации именно с помощью таких технологий. Это может происходить поэтапно, с разбивкой на территориальные кластеры, социальную стратификацию и определенными временными интервалами, позволяющими мониторить данный процесс и его корректировать в зависимости от результатов.
А исследование, проведенное учеными из Университета штата Аризона, Texas A & M и Yahoo, частично профинансированное Управлением военно-морских исследований, может предсказать с 70-процентной точностью вероятность того, что ваш следующий твит будет частью протеста.
«Способы, которыми связанные с протестом события влияют на человека, не наблюдаются, а являются результатом недостаточного знания факторов, действующих в это время, что приводит к тому, что следующий пост будет декларацией протеста», – пишут исследователи в своем докладе, опубликованном в рамках конференции Ассоциации по улучшению искусственного интеллекта в феврале 2016 г..
Исследователи собрали 2686 твитов, связанных с всеобщими выборами в Нигерии, которые имели место с февраля по апрель 2015 г., в месяцы, омраченные политическим насилием со стороны Боко Харам и обвинениями в нарушениях в ходе голосования. Как предсказать, когда кто-то начинает протестовать в Twitter? Это скорее не ваша личная история, а ваша история взаимодействия с людьми в Twitter, которые являются частью протестного движения.
Согласно исследованию вероятность будущих выражений протеста возрастает, если: 1) сообщение упоминает пользователя в связи с протестом; 2) автор поста упоминает пользователя, заинтересованного в акции протеста.
В данном проекте была применена теория Броуновского движения и, как считают авторы, достигнут порог точности в 70 %.
Добавим, что в 2011 г. IARPA финансировала проект Open Source Indicators, на основе результатов которого были предсказаны различные акции протеста в Центральной и Южной Америке в реальном времени.