担心会在未来影响选情
“我当时在寻找像棒球分析那样的,有庞大的数据库而且鲜有竞争者的新领域,就在那个时候我找到了政治这个领域。”起初,他使用笔名“Poblano”。几个月后,他开始使用真名。
希尔沃觉得自己当时将已有的数据套用贝叶斯理论,如此一来他将“小有优势”。美国政治领域原本就充斥着许多数据,而他所使用的贝叶斯理论也不是什么尖端科技。英国神父贝叶斯于18世纪初发现了计算有条件的事件发生可能性的贝叶斯理论。
希尔沃后来表示同意批评者的观点。他甚至不是唯一一个使用贝叶斯理论分析选情的人,其他分析师也同样有不错的准确度。就其属性来说,政治分析不过是平平无奇的数据分析,希尔沃不过是综合已有的民调结果。然而,希尔沃建模分析的关键却在于如何衡量某一数据的重要性。这些数据在历史上有何作用,又有怎样的偏向性,还有什么别的信息可以借鉴?
然而,在美国政治评论圈里,希尔沃的选情分析却是前所未有地准确。
希尔沃不会见说客、党派媒体顾问、竞选经理及新闻发言人之类的人。简而言之,他不是“体制内”的人。美英两国的政治报道就像一个类似垄断集团的体制。在英国,政治圈里弥漫的这种狼狈为奸的氛围是在议员报销丑闻后才受到质疑,而这丑闻则是政治圈外的记者最早曝光的。在美国,希尔沃将政治形容成“交易”。
“如果你表现良好,偶尔会得到独家消息,但这不过是许多既得利益间的游戏。我尽量回避和两边的竞选团队打交道,因为他们所给的信息大都是干扰性的噪音。”
有意思的是,竞选团队(尤其是奥巴马的团队)本身也清楚数据的重要性。据奥巴马团队的竞选经理吉姆梅西纳称,他们请了一位“首席专家”,目的是“量化一切”。数据告知他们应当关注哪些选民及如何吸引他们。由此看来,希尔沃的技能对竞选活动至关重要。
希尔沃认为“书呆子”才是他的“秘密武器”。“我总觉得自己是个局外人。我身边总有朋友,可是我总是有跟他们不一样的观点。我觉得这点很重要。”希尔沃渐渐开始担心:他的能力是否意味着将来他不仅能预测选举结果,还将影响选情。此外,他还担心失去旁观者的优势。“我获得各种机遇,不过我不希望自己堕落或者淹没在体制内。”
进军经济新闻预测领域
希尔沃正在寻找下一个目标一个拥有许多数据却没有太多竞争对手的领域。他认为经济新闻是一个不错的选择,而地方政府选举则是“难以预测”。几年前他曾经对纽约的社区进行过分析你可以通过自己所关注的因素(例如绿化空间和好学校)结合从市长办公室获得的数据得到个性化的居住社区选择分析。
希尔沃在成功预测了2008年美国大选结果(准确预测了50个州中49个州的选举结果)后签下了一份价值70万美元的出版合约,他在书的序言里坦言,与出版社签约的原因是希望他能写出一本“书呆子的胜利”之类的书。但当时没有人能料到他会有多大的成就。不过,当时就连希尔沃自己也不知道这本书会有什么样的反响。
“我当时以为这本书会像是介绍婚介网站那样运作之类的书籍。这本书里的确也提到了这些内容,但是更多的是介绍这当中的哲学原理。这本书是关于客观性和现实的主观性的交集。面对一堆数据时,我们经常处理得很糟糕。拥有更多信息并不意味着我们能更好地预测。”加拿大华人网 http://www.sinoca.com/
|