Библиографическое описание:

Мурзин Ф. А., Дубынин С. В. Модификация теории социального влияния Латане для компьютерных социальных сетей // Техника. Технологии. Инженерия. — 2016. — №1. — С. 14-17.

 

 

Данная статья посвящена проблемам анализа межличностных отношений в компьютерных социальных сетях. Речь идет об использовании теории динамического социального влияния Латане на основе различных характеристик (количественных и структурных), понятий, моделей и методов, которые могут быть определены для компьютерных социальных сетей. Предложены модификации формул теории динамического социального влияния Латане применительно к рассматриваемой задаче.

Ключевые слова: анализ социальных сетей, анализ данных, теория Латане, психологические операции

 

В последнее время все более популярным средством общения между людьми становятся социальные сети. Они, действительно, являются удобным средством коммуникации, а кроме того, открывают новые возможности для анализа потоков информации и поведения людей в процессе общения. Совокупный анализ структуры социальных графов и текстовых данных, получаемых из социальных сетей, по мнению многих специалистов, является наиболее эффективным методом исследования взаимодействий между участниками сети [1, 2].

В статье предложены различные количественные характеристики, которые могут быть вычислены или построены на основе информации, полученной из социальных сетей. Чтобы вычислить уровень влияния окружающих людей на мнение конкретного человека, автором предпринята попытка адаптировать теорию динамического социального влияния Латане [3, 4] применительно к компьютерным социальным сетям.

При анализе взаимодействий участников сети необходимо выяснить ряд вопросов. Как влияют оставленные пользователем сообщения на его окружение в сети? На какую группу пользователей сообщения могут повлиять в целом? И вообще, с какой целью они были созданы? Для того чтобы ответить на эти и другие вопросы, предложен некоторый формальный подход, основанный на модификации теории Латане [5].

Количественные характеристики, отношения и множества, вычислимые на основе данных, получаемых из социальных сетей

В процессе анализа социальных сетей целесообразно рассматривать ряд числовых и нечисловых характеристик, отношений и множеств, естественным образом связанных с пользователями сети и сообщениями, циркулирующими в ней. Важным является то обстоятельство, что все они конструктивны, т. е. могут быть вычислены или построены при помощи соответствующих алгоритмов, конечно, при наличии программного обеспечения, позволяющего «выкачивать» необходимую информацию из сети.

Обозначим  — сообщение («пост», «твит») в социальной сети, видимое множеству пользователей и размещенное на личной странице,  — пользователь сети, который может создавать и пересылать сообщения. Следует заметить, что рассматривать личные сообщения, которыми пользователи обмениваются в узком кругу, не представляется возможным, так как они закрыты для доступа извне и последующего анализа.

Одноместные характеристики:

 — количество людей, которые читают сообщения данного пользователя (т. е. подписчиков этого пользователя);

 — количество друзей у данного пользователя (пользователь сам заносит некоторых людей в список друзей);

 — количество размещений данного сообщения на личных страницах пользователей отличных от автора сообщения;

 — количество сообщений («постов», «твитов»), созданных данным пользователем;

 — «настоящее» имя пользователя, если соответствующая позиция заполнена(это нечисловая характеристика).

Временны’е характеристики:

 — дата создания аккаунта;

 — дата и время создания сообщения.

Множества:

 — подписчики данного пользователя;

 — друзья данного пользователя;

 — имена пользователей, упоминаемые в сообщениях данного пользователя;

 — хэштеги, которые встречаются в сообщениях данного пользователя;

 — внешние ссылки, которые встречаются в сообщениях данного пользователя.

Числовые характеристики, ассоциированные с множествами:

 — количество упоминаний пользователя пользователем ;

 — количество употреблений хештега пользователем ;

 — количество упоминаний внешней ссылки пользователем .

 — количество сообщений пересланных пользователем , полученных от пользователя .

Отметим, что если проводить рассуждения в терминах теории социального влияния Латане [3, 4], то в первом приближении функцию можно считать «силой влияния» пользователя на пользователя .

В работе [4] речь идет о компании вакцинации полиомиелита, которая основывалась на сообщениях (через радио, печать, телевидение, кино и плакаты), оказывающих воздействия на общество, причем телевидение и радио играло наиболее важную роль в городских областях. В нашем случае отдаленным аналогом СМИ можно считать хэштег.

Однако суммарное количество упоминаний пользователя не учитывает тематику сообщений. Если нас интересует динамика изменения мнения людей относительно конкретного вопроса, то стоит учитывать тематику этого вопроса. К примеру, пользователь u может очень часто упоминать пользователя v в контексте вопросов, связанных с искусством, но никогда не упомянет его, если речь идет о политике. Таким образом, если учитывать все упоминания без учета тематики, то получится искаженная система сил влияния. Далее будем считать, что все упоминания и сообщения, участвующие в вычислениях относятся к тематике вопроса, динамика мнения о котором нас интересует.

Подсчет упоминаний в контексте определенной темы также требует уточнения. Для расчета динамики мнения людей важно понимать, что упоминания могут сопровождаться оценочными суждениями. К примеру, пользователь u может упоминать пользователя v вдвое чаще пользователя w, но сообщения с упоминанием пользователя v содержат негативную оценку слов или действий пользователя v, а с пользователем w сообщения имеют положительную окраску. В итоге, несмотря на большую частоту появления пользователя v в сообщениях пользователя u, повлиять на его точку зрения скорее сможет пользователь w, к которому u относится значительно лучше. Из вышесказанного следует, что для вычисления силы влияния вместо следует брать:

Для расчета влияния пересылаемых сообщений также следует учитывать эмоциональную окраску текста, добавляемого к пересылаемому сообщению. К тому же, чтобы получить влияние пользователя v на пользователя u, в этой метрике надо учитывать, только оригинальные сообщения пользователя v, игнорируя случаи пересылки уже пересланного пользователем v от кого-то другого сообщения.С этим уточнением вместо будем использовать:

Для получения суммарного отношения u к v введем величину:

,

где r и m — коэффициенты, определяющие вклад пересылаемых сообщений и упоминаний в суммарное отношение u к v.

Теория Латане социального влияния и ее модификация

Далее, рассмотрим, каким образом можно адаптировать теорию динамического социального влияния, предложенную Латане [3, 4] на случай социальных сетей.

Латане подчеркивал важность трех атрибутов отношений между получателем информации и источником: сила — социальный статус и сила доверия; расстояние — физическое или психологическое; текущее количество — число источников, влияющих на получателя.

Согласно теории динамического социального влияния, уровень влияния на мнение индивидуума относительно определенного вопроса, может быть выражен следующей формулой

,

где:

 — количество социального давления, направленного на -го индивидуума;

 — мнение -го индивидуума (±1) по отношению к данному вопросу, значение +1 соответствует поддержке и –1 соответствует сопротивлению предложению;

 — сила социального влияния ();

 — сопротивление к изменениям;

 — расстояние между индивидуумами и ;

 — степень ослабления влияния по мере увеличения расстояния;

 — общее число взаимодействующих агентов.

Значение постоянной обычно принимается равным 2, в соответствии с величиной использованной в исследованиях Латане. Большее значение этой постоянной означает, что для изменения мнения требуется большее давление, меньшее значение соответствует меньшему усилию. Значение постоянной также обычно принимается равным 2. Большие значения означают, что с ростом расстояния между источником и получателем требуется много большая величина давления.

Величина определяется свойствами пары индивидуумов, она может рассматриваться как показатель легкости общения (передачи информации). При задании данной величины могут учитываться возрастные, национальные, конфессиональные и другие различия. Формула для вычисления может включать в себя физическое расстояние. Например, между населенными пунктами, в которых находятся индивиды. Обычно учитывается факт, что легкость коммуникации подчиняется закону об обратной квадратичной зависимости от физического расстояния [4]. Для компьютерных сетей возможны различные подходы, в том числе такие, когда физическое расстояние не принимается во внимание.

Для анализа социальных сетей можно предложить модификацию формулы Латане в следующем виде:

,

где  — расстояние от пользователя до пользователя . Можно, например, считать, что оно задается отношением «подписчик — подписчик подписчика — подписчик подписчика подписчика и т. д».. В этой формуле учитываются все пользователи, упоминаемые . Можно считать, что все они на него влияют. Также в качестве берется сумма , которая представляет собой суммарное мнение пользователей, читающих сообщения . Отметим, что пересылаемое сообщение всегда содержит имя пользователя, опубликовавшего сообщение, так что он входит в множество .

Как видно из этой формулы, вместо строго положительной , описывающей суммарную силу влияния, мы берем относительную величину, к тому же может быть отрицательной, что соответствует действительности. Если пользователь упоминал в основном в негативном контексте, то совпадение мнения с может подтолкнуть к изменению мнения на противоположное мнению . В действительности такой эффект будет наблюдаться скорее при преодолении величиной какого-то отрицательного порога, до которого при мнение все же будет укрепляться, хотя и не сильно. К тому же сила влияния не должна линейно зависеть от количества положительных и негативных упоминаний. Для решения этих проблем введем величину:

,

где с помощью параметров a, b, c можно задать вышеописанное поведение. Следует заметить, что более точный вид этой функции может быть получен только после исследований реальных данных, полученных из социальных сетей.

С учетом итоговой величины силы влияния, получаем формулу для вычисления социального давления:

.

Внешнее влияние, например влияние СМИ, также может быть учтено [4], если в основную формулу Латане добавить дополнительный член , где  — сила влияния внешних источников на -й индивидуум, , – мнение внешнего источника. Учитывая влияние масс медиа, получаем итоговую формулу

.

Обычно внешний источник также моделируется как агент, но «вне окружающей среды» и с расстоянием 1 до каждого индивидуума ввиду своей «вездесущей» природы. Величина меняется в зависимости от индивидуума, так как каждый человек испытывает различное давление СМИ, эта величина аналогична иногда рассматриваемой «величине доверия» индивидуума к сообщениям, получаемым из внешних источников.

Для социальных сетей аналогом СМИ может являться сила влияния хэштега. При вычислении силы влияния хэштега также можно использовать логику учета эмоциональной окраски сообщений, в которых пользователь использует конкретный хэштег. В качестве силы влияния хэштега будем использовать величину:

Соответственно получаем формулу

,

в которой учитываются все пользователи, упоминаемые , и все хэштеги.

Полученная величина отражает социальное давление, оказываемое на пользователя в социальной сети, осуществляемое, через публикуемые другими пользователями сообщения и хэштеги. На основе этой величины можно моделировать динамику изменения мнения в сети, например, с помощью клеточных автоматов, как в работе [4].

Заключение

Данная работа посвящена проблеме анализа компьютерных социальных сетей. Предложены различные характеристики, даны соответствующие понятия и методы, которые могут быть использованы для анализа динамики изменения мнения в социальных сетях. Итоговые величины пригодны для работы с такими социальными сетями, как Twitter, Facebook, Вконтакте и подобными им.

В процессе получения формул были опущены некоторые вопросы, связанные с технической реализацией вычисления различных аспектов сообщений: определение тематики сообщения и оценка отношения пользователя к другому пользователю, хэштегу или сообщению. Существует множество подходов к вычислению этих показателей, и выбор наилучших методов заслуживает отдельного исследования.

 

Литература:

 

  1.                Charu C. Aggarwal Social network data analytics. — 2011. — 520 p.
  2.                Батура Т. В. Методы анализа компьютерных социальных сетей // Вестник НГУ. Серия: Информационные технологии. — Новосибисрк, 2012. — Том 10, Вып. 4. — С. 13–28.
  3.                Nowak A., Szamrej J., Latané B. From private attitude to public opinion: a dynamic theory of social impact // Psychological Review, 97, — 1990. — P. 362–376.
  4.                Wragg T. Modeling the Effects of Information Campaigns Using Agent-Based Simulation. // Prep.: Command and Control Division, Defense Science and Technology Organization, Australian Government, DSTO-TR-1853. — 2006. — 61p.
  5.                Копылова Н. С., Мурзин Ф. А. Моделирование механизмов социального влияния на основе мультиагентного подхода // Вопросы искусственного интеллекта (Вестник НСМИИ РАН), — 2009. — С. 173–183.

Обсуждение

Социальные комментарии Cackle

Посетите сайты наших проектов