Модель влияния, которую я мои студенты и разработали с целью моделировать социальные взаимодействия между людьми, начинается с системы субъектов С. Каждая сущность с является независимым действующим лицом, которым, например в ситуации группового обсуждения, может быть человек. Эти сущности взаимодействуют и влияют друг на друга в социальной сети. Влияние определяется как условная зависимость между текущим состоянием каждого субъекта ht(с) в момент времени t и предыдущими состояниями всех субъектов ht-1(с) в момент времени t-1. Таким образом, интуитивно можно предположить, на ht(с) воздействуют все другие субъекты. Важным следствием этого марковского предположения является то, что все эффекты состояний, предшествующие по времени моменту t-1, автоматически учитываются, когда мы собираем всю информацию, относящуюся к моменту t-1. Это не означает, что более ранние состояния не имели никакого эффекта или значения; это просто означает, что их суммарный эффект ощущается в период времени, непосредственно предшествующий настоящему.
Каждый субъект с связан с конечным множеством возможных состояний 1, …, S. В момент времени t каждый субъект с находится в одном из этих состояний, обозначенных ht(с) Є (1, …, S). Необязательно, чтобы каждый субъект был связан с одним и тем же набором возможных состояний, но для простоты будем считать, что интервалы латентного состояния для каждого субъекта одинаковы без потери общности. Состояние каждого субъекта недоступно для прямого наблюдения. Однако, как и в скрытой марковской модели (СММ), каждый субъект дает сигнал Ot(c) в момент t, на базе текущего латентного состояния ht(с) и условной вероятности эмиссии Prob(Ot(c)|ht(с)).
Определение социального влияния с точки зрения зависимости состояний – как состояние одного субъекта воздействует на состояние других субъектов и наоборот – идея, заложенная статистической физикой и машинным обучением, . Кроме того, исследователи уже давно используют байесовы сети для того, чтобы лучше понимать и обрабатывать данные временных рядов социального взаимодействия. В более ранних проектах использовались комбинированные СММ, а в более современных – динамические иерархические системы и взаимодействующие цепи Маркова. Модель, разработанная МТИ, уникальна, поскольку она экономно соединяет социальные сети и зависимость состояний.
Социальная система включает в себя множество субъектов, которые взаимодействуют и влияют друг на друга. Социальное влияние может быть выражено в форме условной зависимости между текущим состоянием каждого субъекта ht(с) в момент времени t и предыдущими состояниями всех субъектов ht-1(1), …, ht-1(C) в момент времени t-1. Таким образом, можно предположить, что ht(с) зависит от всех других субъектов. Условная вероятность обозначается как
Prob(ht(c’)|ht-1(1), …, ht-1(C)) (1)
и, естественно, описывает генеративный стохастический процесс. Используя связную/зацепленную цепь Маркова, мы можем взять общий комбинаторный подход и конвертировать (1) в эквивалентную СММ, в которой каждое отдельно взятое состояние обозначает каждую отдельную комбинацию латентных состояний ht-1(1), …, ht-1(C). Таким образом, для системы взаимодействующих субъектов в количестве С в эквивалентной СММ будет пространство латентных состояний размера SC, экспоненциальное к числу субъектов в системе, что неприемлемо в практическом использовании.
Модель влияния, напротив, использует более простой подход с гораздо меньшим количеством параметров. Субъекты 1, …, С оказывают влияние на с’ следующим образом:
Prob(ht(c’)|ht-1(1), …, ht-1(C)) = Σc = (1, …, C) Rc’, c х Prob(ht(c’)|ht-1(c)) (2).
R – это строчная стохастическая матрица с размерами C × C, описывающая силу связи между субъектами. Prob(ht(c’)|ht-1(C)) моделируется с помощью строчной стохастической матрицы Mс, с’ размеров S × S, которая описывает условную вероятность между состояниями различных субъектов и известна как матрица перехода. Как правило, для каждого субъекта с есть C различных матриц перехода, отображающих динамику влияния между с и с’ = 1, …, С. Тем не менее эту ситуацию можно упростить путем замены различных матриц С лишь парой матриц размеров S × S – Ес и Fc: Ес = Mс, с’ описывает самопереходы, и, так как влияние субъекта c на другие субъекты фиксируется аналогичным образом, межсубъектное состояние переходит в Mс, с’ = Fc для всех с’ ≠ c.
Уравнение 2 можно рассматривать так: состояния всех субъектов в момент времени t-1 будут влиять на состояние субъекта с’ в момент времени t. Тем не менее сила влияния варьируется для разных субъектов. Rc’, с выражает силу влияния с на с’. Распределение состояний для субъекта с’ в момент времени t – это сочетание влияний всех других субъектов, взвешенных по силе их влияния над с’. Поскольку R выражает силу влияния между любыми двумя субъектами, мы называем R «матрицей влияния».
Количество параметров растет квадратично с увеличением числа субъектов С и размерностью латентного пространства S. Это в значительной степени облегчает требования для больших учебных выборок и снижает вероятность переподгонки модели, позволяя масштабировать ее для более крупных социальных систем. Кроме того, R может естественным образом рассматриваться как матрица связности для ориентированного взвешенного графа. Силу влияния между двумя узлами, найденными при помощи модели, тогда можно рассматривать как вес связи в социальных сетях. Таким образом, наша модель соединяет условную вероятностную зависимость со взвешенной топологией сети. Действительно, R наиболее часто используется в целях понимания социальной структуры. MatLab-код для оценки параметров модели влияния и примеры задач доступны по адресу: http://vismod.media.mit.edu/vismod/demos/influence-model/index.html.
Модель влияния неоднократно применялась в различных экспериментах в области социальных наук, особенно тех, что включали в себя наблюдение при помощи социометрических бейджей или смартфонов. К предметам этих экспериментов, в частности, относятся закономерности очередности участия в разговоре, доминирование в социальных сетях, а также контексты взаимодействий между людьми. Например, мои студенты и я использовали модель влияния для того, чтобы понять функциональную роль (например, ведомый, ориентир, отдающий и искатель) каждого индивида в группе на основе данных, собранных во время дискуссий, направленных на коллективное решение задач. Мы обнаружили, что выведенная матрица влияния помогла участникам добиться более точной классификации по сравнению с другими, более традиционными подходами. Недавно модель влияния стала применяться для разных систем, включая шаблоны дорожного движения и вспышки гриппа. Кроме того, был также достигнут методологический прогресс, благодаря чему модель теперь включает в себя динамические изменения внутри самой матрицы влияния.
Схожие подходы используют байесовские сети, чтобы понимать и обрабатывать данные временных рядов социального взаимодействия. Примеры включают комбинированные СММ, динамические иерархические системы и взаимодействующие цепи Маркова. Ключевое различие между этими подходами и моделью влияния состоит в том, что матрица влияния R соединяет с зависимостью состояний реально существующую сеть.
Обратная задача: Вывод латентных переменных. В большинстве практических ситуаций нам дан лишь временной ряд наблюдений, который состоит из результатов измерения поведения. Основываясь на этих наблюдениях, мы должны изучить распределение базовых латентных переменных и системные параметры для динамической модели влияния. В нашей работе мы используем вариационный метод достижения максимального правдоподобия (Expectation-Maximization – EM), хотя можно также применять метод среднего поля. Для более подробной информации обратитесь к Вэю Паню и др.
Пояснение: Я описал модель влияния и рассказал о том, как ее можно применять к различным социальным сигналам для того, чтобы выяснить, как субъекты в сети воздействуют друг на друга. В частности, мы можем при помощи полученной матрицы влияния R соединить основную социальную сеть и стохастический процесс трансформации поведенческого состояния индивидов, за которыми ведется наблюдение.
К нашей модели влияния относятся некоторые из тех же ограничений, что сопровождают другие модели машинного обучения: вывод требует достаточного количества данных для обучения, и для достижения лучших результатов необходим процесс настройки. Наиболее важное ограничение заключается в том, что мы пытаемся вывести причинно-следственные процессы по данным наблюдений, в которых, вероятно, задействованы многие механизмы. Если мы обнаружим, что модели поведения двух индивидов коррелируют между собой, это может быть связано с влиянием, но это также может быть последствием выбора (я выбираю взаимодействовать с людьми, похожими на меня) или контекстных факторов (и на вас, и на меня влияет некое событие или третья сторона, никак не отраженные в данных). Недавно было подтверждено, что эти механизмы в общем уже не нужны. Тот факт, что у нас есть временны́е данные, необходимые для того, чтобы проверить причинно-следственный порядок, а также асимметрии в сетях взаимосвязей, чтобы проверить направление воздействия, означает, что мы можем быть более (но не полностью) уверенными в своих результатах, чем если бы мы располагали только данными, полученными методом поперечного среза на основе симметричных взаимоотношений.