因而,许多美国人以愈加置疑的情绪来看待猜测。在民意测验和其他丈量方法的局限性方面,他们现已学到了一个非常重要,乃至是令人欣慰的经历:大数据决议不了命运。
大选的民意、顾客的购买习气、互联网网站的访问量等等,针对这些问题的调查成果都会被放到计算机模型中运算,猜测出人们未来的行为。人们总是期望从可知的丈量方法开端,将丈量成果塞到规划完善的公式中,然后就能对即将产生的事做出牢靠的预期。心存这种期望是能够了解的。
电脑无法读懂人们的心思,民意测验专家也无法读懂。人们并不总是表里如一,或许说他们经常改动主见。人们或许会被压服,也或许不会被压服。一些人说一套做一套。你永久无法写出一组程序,将所有这些以及更多的细枝末节考虑进去。
大数据或许导致大过错。比方,谷歌流感趋势(Google Flu Trends)期望经过互联网查找所获取的数据,来猜测流感季到达峰值的时刻及其强度。但它严峻高估了2012至2013流感季病毒的强度。东北大学的大卫雷泽和休斯敦大学的瑞恩肯尼迪在《连线》杂志中写道,这次失利“不会抹灭大数据的价值”。“但它的确凸显了大数据在运用中存在的一些问题——咱们一般称之为‘大数据虚浮’”。
那么咱们是否应该丢掉数据,只依靠经历、趣闻轶事,或许从咱们认同的人那里听到的信息(或许实在,也或许虚伪)?
假如那样做,便是对这次大选的大数据误差所做出的风险的过度反响。 政治问题博主埃里克埃里克森在《纽约时报》中这样写道, 假如人们认为数据不可信,那么他们就会转向“信赖那些从朋友、家人和社区取得的轶事”“方针的拟定将会根据人们认为的不错的主见,而不是数据显示出来的东西。这或许会……进一步使原本就分解的国家愈加割裂。”他适时地发出了这样的正告。
咱们日子在这样一个变化多端、难以预料的国际中,因而,人们怅然拥抱大数据。当人们自以为知道即将产生什么时,他们感到一丝宽慰。他们在随机挑选中寻觅形式,而且从头脑中抹去了这样一个现实:74%的胜算和26%的败率是一起并存的。所以对大数据的迷信一直在继续。