伴随互联网而来,数据采集途径更多来源更广,体现在数据规模够大够丰富。于是就要有存储这些数据的技术;而数据光存下来不能产生价值,于是就要有做加工处理计算的技术(hadoop)。浅层加工已经不能满足需求情况下,就要做深层加工充分利用数据,于是算法和人工智能又要发展起来。
其实,万变不离其宗,术语再多都是建立在背后的实际需求基础之上的,很多时候是换了个名词而已
首先大数据的概念
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》 中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
其次大数据的技术
大数据的技术开源的有很多,主要围绕着Hadoop的整个生态圈,可以看看这里http://www.csdn.net/article/2015-09-11/2825674 。当然,一般公司,自建大数据平台的成本是很高的,一方面是人员,一方面是基础设施维护。如果是创业公司建议参考阿里云的数加产品https://data.aliyun.com/product/product_index 。
最后是业务整合
这块其实可以说是最难的,云服务消除了技术的壁垒,但是如何让技术赋能业务,就像上面那位仁兄说的,大多数还都在尝试,这里可以参考一些案例https://yq.aliyun.com/activity/156 。就目前来看,大数据主要还是在赋能,而不是创造,更多是帮助已有的业务。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。