2. 邮箱之间的社交分析(SNA)
这一部分的分析就比较好玩了,首先使用PageRank算法来计算各个邮箱的重要性。
结果发现收发最频繁的两个邮箱重要性反而不怎么高:
可以看到,PageRank值最高的邮箱是DNCPress@dnc.org,达到了0.07,看名字似乎是负责对外推送消息的。排第二的是postmaster@finance.democrats.org,似乎与民主党的经济事务有关。
对上述社交网络进行可视化表示,在使用ForceAtlas2展开以后,得到如下图所示:
其中节点表示邮箱,边代表邮箱间发送的邮件。点的颜色深度与收发邮件的数目有关,而点的大小则与PageRank值有关。可以看到上面有两个非常深的节 点,分别是KaplanJ@dnc.org(左上)和MirandaL@dnc.org(右下)。而最大的节点即DNCPress@dnc.org。所以 说啊,邮件往来频繁的也不见得重要性就高,真正重要的人都躲在后面闷声发大财。
从上面还可以看到竞选团队很明显分成左上和右下两个部分,这个后面会讲。
还有一点,上面的图有很多排成很密集的小白点,比如说红线框起来的部分:
这些有很多是外部邮箱,而且往往排在一起的那些邮箱都只与一个邮箱进行单线联系。虽然大部分只是进行了一次通信,不过也可以借此看出每个人负责哪一部分工作。
下方红线部分的邮箱大部分是媒体,包括网络媒体和传统媒体,以及一些LGBT网站、教师工会等等,主要由Miranda L联系。而左上部分的邮箱比较杂,包括一些服务软件公司、策略咨询公司、金融服务公司、服装公司等。总的来讲是维持竞选团队正常运行的,主要由 Kaplan J联系。
由Miranda L负责联系的有(主要看靠下红框,我随机抽了一些,一个个在Google上查后缀这一部分是最累的):
由Kaplan J负责联系的有:
加拿大华人网 http://www.sinoca.com/