杂谈大数据

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 错误的“大数据”称呼,“元芳”你怎么看?数据真的能推动人类文明的发展?数据真的能改变经济体制?今天我们就带着这些问题,温一杯茶,杂谈大数据的那些事。

前几天收到云栖社区馈赠的王坚博士写的《在线》一书,感触很大。首先,我个人觉得这本书让我们认识到了阿里云的成长历程,也让我们看到了技术执着的阿里人在探索道路上的不折不挠。同时也验证了技术进步背后总会有一群人在默默的付出。也见识了心理学博士王坚对于未来的把握如此准确,准确背后是一种信仰和精神。从发展历程上看,不得不说阿里云是培养CTO的最好的大学,没有之一。

王坚博士在书中提到,大数据这个叫法是有些许错误的。于是,我便带着这个问题:“大数据不叫大数据,那它应该叫什么?”去认真的阅读了此书。下面分享一下,我对这个问题的些许看法。

大数据、云计算是共生体。为什么将它们两个放在一起呢?因为它们两个谁也离不开谁,准确的来说它们两个算得上一对宿命鸳鸯。数据不计算永远产生不了价值,计算没有数据作为基础,算是在做无用功。造词者,当时可能没有想到大数据、云计算会走到一起。但是,幸运的是,命运千转百回,它们终成伴侣。

它们彼此让自己更有价值,同时也让彼此的真实面容展现出来。回到我们一开始的问题:“大数据如果不叫大数据,它应该叫什么?”云数据,我个人觉得这个词更适合取代大数据这个词。如果按照大数据的体量来讲,世界上的数据能称得上大的,恐怕只有欧洲大型电子对撞机产生的数据,而今天我们讲得最多的“大数据”,是来自互联网的数据。王坚博士在书中提到了数据是由沉淀效益的,准确的来说,沉淀的越多,价值也就越大。

这样一个效益规律不禁让我想起,由水蒸气聚集形成的云。水蒸气越聚越多,在自然重力的作用下形成了雨,滋润了万物。水一直被视为人类生命之源,水创造了万物,价值也就不可用数字来衡量。同样,今天数据也被视为商业动力之源,指导生产生活。我相信未来数据创造的价值也不可用数字来衡量。

王坚博士在《在线》一书中,提到过,数据同样是有聚合效应的,事实已经证明,这种聚合效应也正在创造着巨大的价值。数据和水蒸气还有一个共同的特征,就是可重复利用。

云数据的价值因其所在的领域而定,在这一点上真实的云也是如此。在干旱的地方,水的价值相对来说很大。对于云数据来说,行业数据沉淀的越多,行业发展的也就越健康。在相对意义上来说,可增长价值也就越小。但是,对于行业数据匮乏的领域来说,发展相对艰难,整个行业都期待能有一场春雨来欢聚它们生存的压力,过去我们靠什么?外部的投资,国家的政策。但是,我们发现这些并不能长久解决问题,只是解决了燃眉之急。

其实,到最后大家能意识到的是:只有自己才能解决自己的问题。今天是一个自救的良机,因为有互联网、云数据、云计算的存在。互联网成为基础设施,数据成为生产资料,计算成为公共服务。

王坚博士在《在线》一书中说:数据成为资源,对于万事万物来说,是世界文明进步的标志。因为什么?数据相对于其他资源来说,是我们人自产的,不是来源于自然界。这对于人类来说,是一个相当震慑的消息。之前,我们总是希望自然界能为我们提供足够多的资源,但是我们发现这似乎有些天方夜谭,尽管在理论上来说,我们可以获得足够多的资源。

或许因为数据的出现,不管是行业,还是人,“自救”会成为时代的主题。不管是自然界赋予人类的资源,还是国家政策、外部投资赋予行业新的生命,到最后都会落到“自救”上。这或许也验证了:只有自己才能救自己,这句至理名言的准确性。

其实,这也就引起了数据到底有什么价值?让今天那么多人为它痴狂,也让行业和人类愿意将自己的命运交付给它。我认为数据并不能直接创造价值!互联网高度发展的今天,拥有数据并不算是一件难事,所有拥有处理它的能力和思想就变得至关重要了。数据创造价值的核心是不变的,那就是:让资源利用率最大化。

马云先生在贵州的时候,就提到过计划经济可能会重新回归,同时他也表示计划经济或许是世界上最好的经济形式。之所以称其为最好的经济形式,无非是其效率是真的高。当然,这个观点一出,瞬间受到了很多经济学教的批评。这其中的原因也是因为上个世纪,我们吃过计划经济的亏。正所谓“一朝被蛇咬,十年怕井绳”。

但是,在怕的时候,我们应该回想过去计划经济体系失败在哪里?计划经济体系失败的原因在于,当时科学技术的限制,中央集权自上而下式的计划经济。上面的人靠不靠谱的不完整的数据样本,来制定经济发展规则。而今天马云先生提到的计划经济不是上个时代的计划经济,它们两个在本质上是由巨大差异的。最明显的是今天的计划经济是自下而上的。在使用的数据体量上也是有天壤之别的,数据的使用量带来了质的变化。这个质的改变是计划经济的质。

另外一个新时代的计划经济和旧时代的计划经济的区别是,新时代的计划经济是完全依靠客观实在的数据得到的;而旧时代的计划经济是带有人的主观意志的计划经济,准确的来说是不客观的。推动这一区别显现的是今天人工智能的高速发展。由机器取代人去做决策,这是时代发展的趋势。也是体现新时代的计划经济一种优越性的一个重要指标。

我们今天使用的市场经济是一双看不见的手,而今天即将复活的计划经济本质是一双由市场数据演变成的一双看得见的手。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6月前
|
存储 分布式计算 大数据
大数据科普
大数据科普
|
存储 消息中间件 分布式计算
大数据简介
大数据简介
241 0
|
分布式计算 搜索推荐 大数据
大数据入门
大数据入门
116 0
大数据入门
|
存储 分布式计算 资源调度
【大数据】入门知识介绍
【大数据】入门知识介绍
366 0
|
数据采集 弹性计算 数据可视化
|
自然语言处理 大数据 索引
|
大数据 开发者 程序员
15篇大数据精品文章大合集
这一次,开发者社区为正在“宅家办公”的小伙伴们献上福利~这次的合集整理了一些比较受开发者欢迎的关于大数据技术领域的优质文章。
1232 0
|
存储 分布式计算 大数据
大数据入门干货
  首先,提及大数据一词的概念。大数据本质还在于数据,但是它有着新的特征亮点。包括:数据来源广,数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至可能是PB级别)、数据增长速度快等等。
1319 0
|
存储 物联网 大数据