“大数据”已经成为当前社会的热门词汇,不但在计算机领域,即使在全社会领域也成为人们耳熟能详的名次。甭管了解不了解,只要聊起新技术,“大数据”必然是挂在嘴边的词汇。要不,你看看全国各地、各城市的发展报告,几乎每个城市、每个地区都要发展大数据产业,牛一点的城市,像北京、深圳,那几乎是要把这个当成支柱产业的架势。就连贵阳,这种以前无论如何无法和信息化、互联网领先城市联系起来的地方,都轰轰烈烈的搞起了大数据产业,而且走在全国前列,实实在在颠覆了我对全国信息化地区格局的认知底线。

那么,到底什么是大数据?我觉得,还是得从大数据是怎么来的一点一点捋一捋。

不过,这不捋不知道,一捋吓一跳。网上关于大数据的由来五花八门,靠谱不靠谱的让人眼花缭乱,我选取了几个毕竟流行的大数据来源的段子和大家分享一下。(有人肯能会说,这不是吃饱了撑的吗,管它从哪儿来,知道它是怎么回事不就行了吗?您说的太对了,持以上观点的童鞋可直接略过本部分,这部分就是没事找着玩的,哈!)

美高梅注册 1

图1 漫话工业大数据

段子一:

尽管“大数据”这个词直到最近才受到人们的高度关注,但早在1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中就提出,“如果说IBM的主机拉开了信息化革命的大幕,那么‘大数据’才是第三次浪潮的华彩乐章。”《自然》杂志在2008年9月推出了名为“大数据”的封面专栏。从2009年开始“大数据”才成为互联网技术行业中的热门词汇。

这个段子说,大数据一次最早是1980年提出的,说的是有根有据。兄弟我还真找来这本书,1983年三联书店朱志焱先生翻译的,花了N长时间翻阅了一遍,反正我没找到,哪位朋友如果找到了这个话,麻烦告诉我,我找到好辛苦的……

不过,虽然探寻“大数据”源头之旅失败了,但是,我没想到,这本30多年前的书着实让我惊叹了一把,书中关于数据和信息,有一段文字堪称经典,摘录如下:

第十四章 智能环境 P194、P195

当社会记忆储存在人类头脑中时,它不断被侵蚀,更新和变动,不断地以一种新的方式组合,再组合。它是积极的,能动的。它确确实实是充满着活力,是有生气的。

当工业文明把很多社会记忆从人类头脑中取出来时,记忆变成了客观对象,体现在人工印刷品,书籍,工资单,报纸,照片和电影中。但是一旦符号被写在纸上,复制在照片上,摄入电影中,印刷在报纸上,就变成消极静止的东西了。只有当这些符号再一次被人脑所吸收时,这些东西才变活了,并且以一种新的方法操纵和重新组合。第二次浪潮文明在急剧的扩大社会记忆的同时,实际上也将社会记忆冻结了起来。

第三次浪潮信息领域所以称为历史性的大事,不仅是它极度地扩大了社会记忆,而且还把它起死回生。因为计算机能处理它储存的数据,这样就出现了一个史无前例的现象:社会记忆变得既丰富又活泼。这两者的结合,证明是有推进力的。

这种情势将释放出新的文化能量。因为计算机不仅能帮助我们将“瞬息即变文化”组成或合成为现实的有条理的模式,它也开拓了可能的极限。图书馆,档案馆都不能思考,更不用说用非传统的方式来思考了。但是相比之下,我们可以要求计算机“思考难以想象的和以前没有想到的事情”。这样就有可能出现大量新的理论,新的思想,新的观念,新的艺术见解,新的技术进展,新的经济和政治的创见。老实说,在此以前,这些事情都是难以置信和不能想象的。这样,它促进了历史变革,向第三次浪潮多样化的社会挺近。

以上这段对于数据的认识牛不牛?太牛了,再看看2016年王坚博士的《在线》一书的观点:

★今天数据的意义并不在于有多“大”,真正有意思的是数据都变得在线了,这恰恰是互联网的特点。……写在磁带和纸上的数据,作用是有限的;

★离线的数据难以产生最大化的经济价值,在线的可以;离线的数据难以产生最大的社会竞争力,在线的可以;离线的数据难以产生大的影响力,在线的可以;

★数据本身没有价值,…直到你有计算能力去处理才会产生价值。计算,如同其他基础设施一样,能够把沉寂的数据“沙子”变成经济、产业、财富的“金矿”。

美高梅注册,一比较,有没有一种跨越了30年的两位大牛共论数据之道的感觉,1980年啊,托老先生就对数据有如此深刻的见解,让我瞬间对他的崇拜之情犹如滔滔江水,连绵不绝……

好像有点跑偏了,好吧,我们再拐回来。

段子二:

大数据是SGI的首席科学家 John R. Masey 1998年首次提出的。

SGI是个什么东东呢?SGI(Silicon Graphics
)是美国硅图公司,成立于1982年,是一个生产高性能计算机系统的跨国公司。这公司虽然不太出名,但是也是很牛X的一家公司,许多电影,包括《侏罗纪公园》、《魔戒》、《泰坦尼克号》等等,均是在SGI的图形工作站上制作出来的。

这个PPT我也找到了,标题是《Big Data …and the NextWave of
InfraStress》,其中的InfraStress是Infrastructure
Stress的缩写,他主要描述的是由于数据量的增大给计算机的各种基础设施,包括CPU啊、内存啊等等带来的压力,感觉和我理解的大数据沾那么一点点边吧,不过也就一点点。

段子三:

最早提出“大数据”概念的是全球知名咨询公司麦肯锡,在其2011年的研究报告《大数据:下一个创新、竞争和生产率前沿》中首次提出“大数据”一词,认为:数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。

这个段子就有点扯了,因为08、09年的时候,大数据就开始有很多文章谈论了,麦肯锡应该是比较早进行研究和应用大数据的公司,但要说是他提出来的,恐怕他自己都不信。

啰啰嗦嗦说了这么多,那么,到底大数据的概念是谁先提出来的呢?看来,这个版权暂时找不到拥有者,这哥们损失得多大啊,提出了一个上万亿产业的概念,不赶紧出来认领,看来确实不是我,我没有那么优秀的品质,哈!

不过我认为,计算机及互联网的发展史上,这种无头公案非常多,因为最早使用这个词汇的,未必是今天我们理解的含义,它会在信息化飞速发展的浪潮中不断地完善、发展、丰富着自己的内涵和外延,”大数据“只是一个名词,我们更多的是如何理解它,应用它(看到这儿的朋友是不是有一种要冲过来打我的冲动,冷静,冷静,冲动是魔鬼啊J)。

那么,到底怎么理解大数据呢,请听下回分解。

相关文章