第1章 深陷数据过载的愁云惨雾
“它无所不在,它无所不知,它的名字是大数据。”
——呆伯特,2012年7月
流感预测器也闹“流感”
2008年是大数据发展的重要一年,尽管当时几乎还没有人提出大数据分析这一概念。就职于在当时仍备受推崇的、雄心勃勃的搜索引擎供应商谷歌的一小撮数据科学家在《自然》杂志上发布了一种大数据应用的方法,即利用大数据(的检测功能)令地球上的人类更加健康(少生病)。科学家们将这种应用命名为GFT:谷歌流感潮(Google Flu Trends)。科学家们宣称,在不与医生沟通的情况下,谷歌可以预言美国境内的流感疫情暴发和地理传播路径。科学家们的预测速度比当时的监测部门美国疾病控制与预防中心(CDC)更快、更准确。
几十年来,为了实现对流感疫情的监测,CDC搜集相关医疗诊断报告后,能够据此推测出全国居民的健康状况,推测结果公布时间较现实情况有一周左右的延迟。基于这种推测结果,CDC则可采取相关的公共卫生控制措施,例如开展大规模的疫苗接种。谷歌的科学家们基于他们的数据库,找寻到了一种预测居民健康状况的更容易的方法:他们统计居民在搜索引擎中搜索例如“流感有哪些症状”或者“附近有哪些药房”等词条的频率,标记搜索人所在的地点,并将这些统计数据与以往的流感疫情情况比对修正。在2008年,聚合并定位数以百万计的流感相关的搜索信息仅需不到一夜的时间。此外这种研究也证实了与专家发放调查问卷询问的方式(在调查流感疫情时,专家指的就是医生)相比,基于搜索请求统计的分析方法在一定区域内可以得出更微观精细的预测结果。
Loading...
未加载完,尝试【刷新】or【关闭小说模式】or【关闭广告屏蔽】。
尝试更换【Firefox浏览器】or【Chrome谷歌浏览器】打开多多收藏!
移动流量偶尔打不开,可以切换电信、联通、Wifi。
收藏网址:www.finalbooks.work
(>人<;)