【希拉里在FBI的“帮助”下躲过了一桩邮件门,却又撞上另一桩。在民主党全国代表大 会前夕,维基解密公开了一批民主党高层的邮件。人们于是乎知道了这些美国民主党人是如何“钦定”希拉里,甚至不惜给桑德斯使绊子。除此之外,这些邮件还透 露了什么信息?网友“Multiangle”分析了其中6000封左右的邮件。】
花了一个晚上加上午的时间,写了个 分析邮件往来关系的单线程小爬虫来玩玩,很简陋而且代码也比较乱,实现的功能也比大神差远了,不过能生成基本的社交关系数据。分析了6000封左右邮件, 对收件人之间的关系进行了简单的分析,也没什么严密的分析计划,分析到哪就写到哪吧。
1.首先来看收发邮件数
6000封邮件涉及了600个左右的邮箱。单看发送邮件的数目,前五强邮箱分别是:
kaplanj@dnc.org 645封
MirandaL@dnc.org 645封
DNCPress@dnc.org 200封
PaustenbachM@dnc.org 149封
postmaster@finance.democrats.org 147封
单看接收和抄送的数目,则前五强分别是:
kaplanj@dnc.org 2224封
MirandaL@dnc.org 1030封
PaustenbachM@dnc.org 656封
Comm_D@dnc.org 649封
comers@dnc.org 540封
具体的一些信息如下图所示(按照发送邮件数目排序):
如果按照发件数或者收件数对各邮箱进行排序,都可以看到社交分析中常见的指数曲线:
令我比较惊讶的是,在对发送邮件数取对数以后,所得到的结果仍旧是一条指数曲线。如下图所示:
这表明,这个竞选团队中极少数人有着极大的话语权。毕竟在求对数以后一般是得到一条直线的,例如微博中排名前几千的大V的粉丝数分布,就像下面这个图(原谅我的灵魂画技):
纵轴在接近0的地方会迅速向0靠近,这是由于对数函数本身的性质导致的。
不动明王解读:
更正表述小問題
按照社交模型,是&在纵轴接近0的地方会迅速向縱軸靠近&,而不是向0靠近加拿大华人网 http://www.sinoca.com/