大数据时代已经来临
①在甲型H1N1流感爆发的几周前,互联网巨头谷歌公司的工程师们在《自然》杂志上发表了一篇引人注目的论文。它令公共卫生官员们和计算机科学家们感到震惊。文中解释了谷歌为什么能够预测冬季流感的传播不仅是全美范围的传播,而且可以具体到特定的地区和州。谷歌通过观察人们在网上的搜索记录来完成这个预测,而这种方法以前一直是被忽略的。谷歌保存了多年来所有的搜索记录,而且每天都会收到来自全球超过30亿条的搜索指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。
②发现能够通过人们在网上检索的词条辨别出其是否感染了流感后,谷歌公司把五千万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年间季节性流感传播时期的数据进行了比较。其他公司也曾试图确定这些相关的词条,但是他们缺乏像谷歌公司一样庞大的数据资源、处理能力和统计技术。
③虽然谷歌公司的员工猜测,特定的检索词条是为了在网络上得到关于流感的信息,如哪些是治疗咳嗽和发热的药物,但是找出这些词条并不是重点,他们也不知道哪些词条更重要,更关键的是,他们建立的系统并不依赖于这样的语义理解。他们设立的这个系统唯一关注的就是特定检索词条的频繁使用与流感在时间和空间上的传播之间的联系。谷歌公司为了测试这些检索词条,总共处理了4.5亿个不同的数字模型。在将得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现,他们的软件发现了45条检索词条的组合,一旦将它们用于一个数学模型,他们的预测与官方数据的相关性高达97%。这是一种可视化的呈现手段,和疾控中心一样,他们也能判断出流感是从哪里传播出来的,而且他们的判断非常及时,不会像疾控中心一样要在流感爆发一两周之后才可以做到。
④所以,2009年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,谷歌成为了一个更有效、更及时的指示标。公共卫生机构的官员获得了非常有价值的数据信息。惊人的是,谷歌公司的方法甚至不需要分发口腔试纸和联系医生它是建立在大数据的基础之上的。这是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。基于这样的技术理念和数据储备,下一次流感来袭的时候,世界将会拥有一种更好的预测工具,以预防流感的传播。
⑤除了在公共卫生领域,大数据引起社会生活巨大变革的例子数不胜数,大数据(bigdata)一词也越来越多地被提及。人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。因为不再追求精确度,不再追求因果关系,而是承认混杂性,探索相关关系,数据被巧妙地用来激发新产品和新型服务。数据正成为巨大的经济资产,成为新世纪的矿产与石油,将带来全新的创业方向、商业模式和投资机会。因此,发达国家纷纷开发利用大数据来夺取新一轮的竞争制高点。
⑥正如《纽约时报》2012年2月的一篇专栏中所称,大数据时代已经降临,决策将日益基于数据和分析而作出,而并非基于经验和直觉。所有领域都将开始这种进程。
(来源于求实理论网,有增删)
1.关于大数据的分析和理解,正确的一项是( )(3分)
A.大数据,就是用来描述和定义信息爆炸时代产生的正成为如新世纪的矿产与石油一样巨大经济资产的海量数据。
B.大数据就其数据和技术而言,我们可以得出其基本特征:数据资源庞大,精确度较高,信息混杂,处理速度快。
C.大数据赋予当今社会一种新型能力,即通过对海量数据进行分析,从而获得有巨大价值的产品、服务或论断。
D.大数据就其价值而言,《纽约时报》曾称人们和各个领域的决策都属于海量数据和分析,而不是基于经验、直觉。
2.下列对原文思路的分析,错误的一项是( )(3分)
A.①段指出谷歌公司成功预测了2009年H1N1流感的传播,并说明是大数据的支撑与帮助。
B.②③段紧承①段详细介绍了谷歌公司对庞大数据资源的采集过程、处理方法、处理能力和统计技术。
C.④段总结谷歌成功预测流感的巨大价值,同时指出这种建立在大数据基础之上的方法前景无限。
D.⑤段阐述了大数据的溉概念、技术理念和巨大的经济价值,与前文呈分与总的关系。⑥段卒章点题。
3.关于谷歌如何预测2009年H1N1型流感的传播,表述错误的一项是( )(3分)
A.谷歌把多年来保存的搜索记录和每天收到的30亿条以上的搜索指令作为数据资源。
B.通过人们在网上搜索的词条辨别出其是否感染了流感,并关注病理状况及其所用药物。
C.把最频繁检索的特定词条和前几年间季节性流感传播时的数据进行比较,并得出联系。
D.谷歌用数学模型之类的可视化手段呈现其相关性,从而判断流感的源头及传播范围。
本阅读试题来源:2015安徽皖北协作区3月联考语文试题及答案
相关推荐2015年安徽高考各市模拟试题及答案【汇总】
2015年全国高考模拟试题及答案
参考答案
1.C 解析:A还应包括对数据的处理能力和统计技术,或者与之相关的技术发展与创新B 精确度较高错,原文不再追求精确度。D原文将日益基于,将开始这种进程。
2.B 解析:没有介绍采集过程,处理能力和统计技术只是提及。
3.B 解析:找出这些词条不是重点,他们建立的系统并不依赖于这样的语义理解。