特朗普的意外胜利是大数据的失败吗?不是真正的

民意调查遵循IT的老格言:“垃圾进,垃圾出”

盖奇斯基德莫尔/特朗普运动

最近几天,大多数选举预测机构和民意调查都预测,共和党人川普会在美国总统大选中败给民主党人希拉里。克林顿。

他们大错特错了。而失败的预测可能会让人对大数据和客户关系管理等一些热门技术领域产生怀疑。

一些数据专家说,不会这么快。民意调查和预测的问题FiveThirtyEight可能更多的是数据收集,而不是数据处理,他们说。

数据分析工作很好《点球成金》模型CRM分析师Denis Pombriant,比格尔研究集团的创始人说,对奥克兰运动家来说,棒球数据不同于选举调查。他说,一个多世纪以来,统计人员一直在收集“高度可靠”的棒球数据,而民意调查数据则比较模糊。

他在周三的一份研究报告中写道,所有的数据分析都依赖于“良好的、干净的、有效的数据,因此,只能在纯棒球以外的领域使用”。“如果不关心,你就会回到GIGO的老IT格言,或者‘垃圾输入,垃圾输出’。”

+更多选举报道:选举被黑客攻击的可能性有多大?+

企业战略集团(Enterprise Strategy Group)的高级分析师尼克·鲁达(Nik Rouda)补充说,民意调查并不是真正的大数据。他在电子邮件中说:“样本的大小对于一个民意调查来说当然足够好了,但可能没有满足关于数据量、数据多样性的定义,以及与实时即时性、机器学习和其他高级分析相比的历史深度。”“如果说有什么不同的话,我认为大数据技术的更多应用会带来更好的预测。”

鲁达说,虽然两个总统竞选团队都依赖选民的个人资料,但更有力的个人资料和“对群体行为的分析将会显示出一个清晰的画面。”“这是传统方法的失败,而不是数学或大数据的失败。”

他表示,预测机构可能会有更多空间将民意测验与社交媒体结合起来。他说,数据处理者应该更多地关注微妙的财务指标。

值得注意的是,大多数全国民调显示希拉里只以微弱优势获胜,有些民调还在误差范围内。截至周三上午,希拉里以18.5万票的优势赢得了普选,此次选举共投出1.185亿张选票。但克林顿至少输掉了27个州,其中包括几个民调预测她会赢的州,以及在美国大选中会输掉的州选举团制度

不过,中国经济研究中心经理王教授说,这些错误的预测似乎并不是误差幅度的问题普林斯顿的选举联盟截至周二上午,克林顿有99%的几率获胜。

王在邮件中说,投票结果出现了“系统性错误”。“整个群投票了,作为一个群体。这是一个非常大的错误,在总统和参议院级别,上下都有大约4个百分点的错误。”

王说他仍在评估结果。预测不正确的一个原因可能是所谓的“未做决定的选民”做出了迟来的决定。

他说:“民意调查人员使用‘未决定’这个词,但这实际上意味着他们无法用语言表达自己的偏好——他们甚至可能不知道自己的偏好是什么。”

王说,在竞选初期,大约有20%的倾向共和党的选民还没有决定。“对他们来说,投票给特朗普是对党派忠诚和对一个相当激进的候选人的反应之间的斗争,”他补充说。“可能是对政党的忠诚赢得了胜利。”

Wang和Ovum的大数据分析师Tony Baer都表示,民意调查可能低估了难以触及的选民。贝尔说,随着许多美国居民不再使用固定电话,民调机构也更难找到合适的人选。

在其他情况下,人们对民意调查的反应可能是在说谎。贝尔在电子邮件中补充说,民意调查人员可能得到了“错误的信号”。

“当你有足够大的数据集,你可以找到几乎任何事情的信号,”他补充说。“因此,这就强调了识别正确的数据集和提出正确的问题,并无情地用扩展到更多或不同数据集的测试用例来测试你的假设。”

当被问及对特朗普的胜利有何反应时,贝尔说,他“和其他人一样困惑”。

加入网络世界社区足球竞猜app软件脸谱网LinkedIn对最重要的话题发表评论。

版权©2016足球竞彩网下载

工资调查:结果在