Книга: Много цифр. Анализ больших данных при помощи Excel
Назад: Что такое сетевой граф?
Дальше: Краткое введение в Gephi

Визуализируем простой граф

Сериал «Друзья» был одним из самых популярных комедийных шоу 1990-х и начала 2000-х годов. Действие разворачивается с участием шестерых друзей: Росса, Рейчел, Джоуи, Чендлера, Моники и Фиби. (Если вы никогда не слышали о них, то вы либо чрезвычайно юны, либо безвылазно провели всю жизнь в пещере.)
Эти шестеро постоянно вовлечены в романтические отношения различного характера: настоящие романы, выдуманные романы, которые никогда ни к чему не приводят, романы на спор и т. д.
Представьте, что эти персонажи – вершины (или узлы) графа, а их отношения – ребра. С ходу могу начертить такие ребра:
• Росс и Рейчел, разумеется;
• Моника и Чендлер, которые, в конце концов, поженились;
• Джоуи и Рейчел, у которых был недолгий роман, но в итоге они нашли, что это «слишком странно»;
• Чендлер и Рейчел, которые встречались в серии про инцидент со столиком для бассейна. В этой серии Рейчел представляет, что было бы, если бы она встречалась с Чендлером;
• Чендлер и Фиби, которые играют в отношения и, в конце концов, вынуждены поцеловаться, потому что Чендлер отказывается признать, что он встречается с Моникой.
Эти шесть персонажей и пять отношений могут быть представлены в виде графа, показанного на рис. 5–1.

 

 

Довольно просто, не так ли? Вершины и ребра. Вот и все, что нужно для сетевого графа. Заметьте, насколько сетевые графы не похожи на графики, которые вам встречались: точечные диаграммы, линейные графики и столбчатые диаграммы. Они – совсем другие «звери».
На рис. 5–1 изображен неориентированный сетевой граф, потому что отношения обоюдны по определению. А вот данные, например, из Twitter будут уже ориентированным графом: я могу подписаться на вас, но вы не обязаны подписываться на меня. Ребра ориентированного графа обычно изображаются стрелочками.
Один из минусов использования Excel для работы с сетевыми графами состоит в том, что, в отличие от разнообразных графиков и диаграмм, граф нельзя визуализировать встроенными в Excel средствами.
Так вот, в этой главе я намереваюсь отступиться от собственных правил и использовать стороннее программное обеспечение для расчетов и визуализации графов, а именно Gephi. Его подробное описание вы найдете в следующем разделе. Вы вправе игнорировать в этой главе все, что связано с Gephi, если хотите. Весь поиск и добыча сетевых данных могут быть выполнены без визуализации сети в Gephi, я прибегаю к нему просто потому, что оно мне нравится.
Но если вы хотите работать с таким типом графов, то кроме визуализации вам понадобится числовое представление данных. Одно из подобных интуитивных представлений называется матрицей смежности. Матрица смежности – это просто таблица вершин, заполненная 0 и 1, где 1 в конкретной ячейке означает «ребро здесь», а 0 – «эти вершины не связаны».
NODEXL
Если вы пользуетесь Excel 2007 или 2010, то Social Media Research Foundation выпустила для вас шаблон NodeXL, благодаря которому вы можете строить сетевые графы в Excel. Я не буду его описывать в этой книге, потому что век развития программного обеспечения только начинается и этот шаблон не совместим с LibreOffi ce и Excel 2011 для MacOS. Если вам интересно, можете поискать NodeXL для вашей системы здесь: .
Вы можете создать матрицу смежности из данных о «Друзьях», вроде той, что изображена на рис. 5–2 (на мой взгляд, эта матрица похожа на лобстера, образованного космолетами из игры Galaga). Имена друзей расположены по вертикали и горизонтали, а отношения между ними показаны 1. Обратите внимание на симметричность матрицы по диагонали – оттого, что граф неориентированный. Если Джоуи имеет ребро с Рейчел, значит, верно и обратное – и матрица смежности показывает это. Если бы отношения были односторонними, матрица бы получилась несимметричной.

 

 

Ребра здесь представлены единицами, однако это вовсе не обязательно. Ребрам можно добавить числовые значения, например вместимость: представьте самолеты разной вместимости, летящие по определенным маршрутам, или различные волновые диапазоны, использующиеся для разных целей в информационной сети. Матрица смежности со значениями также называется матрицей мер конвергенции.
Назад: Что такое сетевой граф?
Дальше: Краткое введение в Gephi

БУРГЕР КИНГ
Я не робот!
Антон
Перезвоните мне пожалуйста по номеру. 8 (953) 367-35-45 Антон
Антон
Перезвоните мне пожалуйста 8 (495) 248-01-88 Антон.