越来越复杂的大数据需求意味着创新的压力仍然很高。许多公司开始明白,客户的成功离不开数据方面的工作。不利用数据分析的公司会开始歇业,而成功的企业认识到发展的关键是数据精炼和预测分析。
本文通过Forrester的数据分析,总结了2017年大数据产业的几大趋势,与诸君分享。
Forrester的预测数据
Forrester在一份最新的报告中说,2020年之前,使用人工智能(AI),大数据和物联网(IOT)等技术开展新业务的企业,每年将比不使用这些技术的同行多赚1.2万亿美元。
在所有业务中,2017年人工智能的投资将同比增长300%以上。通过复杂系统的高级分析和机器学习技术得到智能认知,AI将为企业用户提供强大的、以前从未有过的洞察。Forrester表示,通过帮助缩小从洞察到行动的差距,AI能够在营销,电子商务,产品管理以及其他领域推动用户做出更快的业务决策。
人工智能、大数据和物联网技术的结合将使企业能够投资并成功使用它们,以克服数据访问障碍并挖掘有用的信息。在2017年,这些技术将增加业务的数据访问,扩展可分析的数据类型,并最终提高洞察的成熟度。大数据技术将趋于成熟,供应商也越来越多地将其与传统的分析平台集成,这将有助于将其获得的广泛信息纳入现有的分析流程中。使用单一架构来实现大数据与灵活可操作洞察的融合将变得更加广泛。
Forrester预计,可提供物联网洞察能力分析的第三方供应商在2017年将翻一翻。这将鼓励他们的客户投资更多的网络设备并挖掘分析其产生的数据。例如,Forrester发现,67%的电信决策者正在考虑或优先考虑在2017年开发物联网或M2M(机器/人与机器/人的交互)计划。
Forrester表示,增加对物联网的投资将带来新型的分析,这反过来也将带来新的业务洞察。目前,许多由边缘设备(如手机,可穿戴设备或汽车)产生的数据被直接丢弃。而实际上,这些数据可以被当作“不成熟的数据”并进行分析实践,这导致很多企业浪费了这些洞察的机会。
在2016年,不到50%的数据分析决策者采用了位置分析。Forrester预计,到2017年底,采用位置分析的企业将增长到三分之二以上。
2017年将出现的三大可喜现象
由于客户正是通过产品和服务来与所处的世界进行联系,因此,新型分析产生的新洞察将使企业更好地优化其客户体验。Forrester看到了很多令人欢欣鼓舞的迹象,越来越多的公司制订了用于消除客户信息壁垒的投资计划,这将使他们能够更好地协调和提高整个企业的洞察力。具体来说,Forrester表示在2017年将看到以下三个可喜现象:
1、首席数据官(CDO)职位将成为常态化
到2017年,首席数据官(CDO)职位将成为常态化,而在2016年,大概只有46%的公司设立了CDO职位。但是要真正成为一家洞察驱动型企业,企业必须由首席信息官(CIO)和首席营销官(CMO),甚至CEO负责部分数据业务,以便根据数据驱动洞察的结果迅速推动业务行动。
2、客户数据管理项目将增加75%
2016年,39%的企业首次实施了大数据计划,通过跨渠道跟踪,了解并熟知用户的使用习惯,洞察用户的深入需求,从而为用户提供定制化的服务。还有近三分之一的企业表示计划在未来十二个月内采用大数据技术提供解决方案。
3、采用洞察力驱动的企业将显著增加
Forrester预计,随着企业在2017年实现数字化转型,在企业范围内采用洞察力驱动的实践将显著增加。率先采用客户智能实践和战略的企业将成为业务转型的典范。长期来说,基于人工智能的服务和应用最终会改变大多数行业并重新分配劳动力。
2017年,塑造大数据行业的五大趋势
1.物联网(IoT)
公司日益期望从所有数据中获得价值,企业组织将不得不改动技术,以便与物联网数据衔接起来。这在数据治理、标准、健康保障、安全和供应链等方面带来了无数新的挑战和机遇。
物联网和大数据是同一枚硬币的两面,数十亿与互联网连接的“物件”将生产大量数据。然而,这本身不会引发另一场工业革命,不会改变日常的数字化生活,也不会提供拯救地球的预警系统。来自设备外部的数据才是企业让自己与众不同的方面,结合上下文来捕获和分析这种类型的数据为公司带来了新的发展前途。
2.深度学习
深度学习主要用于从大量未标记/未监督的数据当中学习,因而对于从大数据中提取有意义的标识和模式颇具吸引力。比如说,它可以用来识别许多不同类型的数据,比如视频中的形状、颜色和对象,或者甚至是图像中的猫,就像谷歌研制的一个神经网络在2012年所做的那样。因此,企业可能会看到更多的注意力投向半监督式或未监督式训练算法来处理进入的大量数据。
3.内存中分析
不像常规的商业智能(BI)软件对存储在服务器硬盘上的数据运行查询,内存中技术查询的是载入到内存中的信息,这可以通过减少或甚至消除磁盘输入/输出瓶颈来显著提升分析性能。就大数据而言,正是由于TB级系统和大规模并行处理,让内存中分析技术更令人关注。
在现阶段,大数据分析的核心其实是发现数据。要是没有毫秒级延迟,面对数百万次/数十亿次的迭代,运行迭代以查找数据点之间的关联就不会成为现实。在内存中处理的速度比磁盘上处理要快三个数量级。
4.云计算
混合云和公共云服务越来越受欢迎。大数据成功的关键是在弹性基础设施上运行(Hadoop)平台。我们会看到数据存储和分析趋于融合,带来新的更智能的存储系统,它们将经过优化,用于存储、管理和排序庞大的PB级数据集。展望未来,我们可以预计会看到基于云的大数据生态系统将继续迎来发展,不仅仅局限于“早期采用者”。
5.Apache Spark
Apache Spark在点亮大数据。流行的Apache Spark项目提供了Spark Streaming技术,通过主要采用一种在内存中微批量处理的方法,近实时地处理数据流。它已从Hadoop生态系统的一部分,变成许多企业青睐的一种大数据平台。