2017年关于数据科学六大预言

简介:


今天,数据正在以前所未有的方式创造和促进着企业成长和商业利润。在过去的十年间,先进的数据科技和高级分析工具的出现,已经使商界精英们从他们的数据中收获无数的利益,然而,对大多数人而言,他们只是触及了数据潜能的最表面。数据科学正在开天辟地的让企业成功地撬动这个巨大的潜能。


麦肯锡2013年出版了一份特别的报告,预言全球商业界将会感觉到下一个十年数据科学专业人士的紧缺,尤其是善于从大量静态和动态(实时)数据中发现有价值的情报的数据分析师,缺口达150万。这个预言现已成真,人们更加关注向企业和高等教育机构推销数据管理的重要性,从而使得整个业界都能应对几年之前还不完全理解的人才短缺问题。


数据科学领域的动荡要持续到2017年,伴随着更多的增长和更大的可能。

 

◆ 

数据科学的力量


要理解为什么数据科学对商业为何如此关键,有几个前提需要理解:

  • 在商业界需要它的时候,在需要它的领域,数据科学总能提供最精准的解决方案。

  • 数据科学帮助做出更好的商业决策,并对这些决策的影响进行精确的研究。一份过去的哈佛商业评论研究指出,依赖数据进行决策的大生意一般比同行的利润高出6%。

  • 当人的直觉和经验都失败时,数据科学对未来可以做出更加准确的预测。有了数据科学,商业不再靠猜。

  •  有了高效、智能的设备和现代化的分析平台,客户追踪已经成为现实。实时获取客户信息有助于精确响应。


鉴于以上各点,可以理解为什么在这个特定的时刻,数据科学正在经历全球化的革命。一直以来限制数据科学发挥作用的科学和技术问题都已逐步解决,2017年数据管理业界将在全球迎来一些主要的改变。明年,哪些地方可以见到数据科学的引领,请看下面这张精准计算的预言清单:


2017 数据科学预言1:机器学习大行其道


问答网站Quara对机器学习将如何影响数据科学业界的变革做了专题问答。为了回答这个问题,克劳迪娅•珀立弛(Claudia Perlich),Dstillery公司的首席科学家,纽约大学的客座教授,肯定地认为,由于数据科学与机器学习的密切关系,在将来的商业分析界,不懂机器学习是无法生存的。


她觉得随着机器学习与数据科学家们关系越来越紧密,掌握机器学习的基础技能对数据科学领域的职业发展而言将成为一种必须。完整的解释发表在
福布斯的博客上:  http://www.forbes.com/sites/quora/2016/09/08/machine-learning-will-bring-some-big-changes-to-data-science-as-we-know-it/#16a5cc073b12

 

2017年机器学习的火热仍会继续笼罩着数据科学家们。各种机构为了将拥有可靠机器学习技能的数据科学家招入麾下,扩充其数据科学部门,不惜付出额外的努力。


2017数据科学预言2:物联网数据流战胜传统商业智能


Gartner几年前就做出了这样的预言,而在2017年,这样的预言会比以往更可信。由于带有传感器的装置日益席卷人类社会的方方面面,大约50%的商业智能(BI)平台会投资事件数据流。这样的趋势,会导致一个新的商业智能分支浮出水面:捕获来自附着装置的实时数据宝库,在天气预报,制造业,电力,语音识别和健康检测系统,以及其他等等领域,都将得到广泛应用。由于自助式分析的兴起,商业智能服务商所和那些软件即服务(SaaS)供应商所提供的分析能力将不再有差距。

 

根据通用电气《工业网络见解报告》,物联网(Internet of Things (IoT))市场在未来20年,将为全球GDP贡献10-15万亿美元,从数据科学人才市场物联网技术的流行度骤升也可证实这一点。IBM、英特尔,Verizon和微软都在广招具有物联网技术的数据科学家。参见文章:http://www.dataversity.net/life-data-scientist/


2017数据科学预言3:大数据技术支出大增

 

Gartner预言过到2016年,大数据商业影响的迷惑和不确定性将大大降低,变得可预见。这个预言也应验了。很多围绕大数据“实际价值 vs 感觉价值”的争论已经偃旗息鼓,而大数据技术已经从早期的“萌芽”期走向成熟。今天,对成功的数据科学项目而言,大数据技术比以往更加主流化,更加必备化。


迄今为止,大约只有30%的商业界经历了大数据革命,但是2017年,肯定会看到一个大数据投资的持续增长,尤其是处理“大容量,高速度和多样性的数据”的成本大幅下降以后。根据Information Week,大数据分析的销售额2019年会达到1870亿美元。

 

2017数据科学预言4Hadoop市场的持续增长


长,已经证明,企业的IT预算里,Hadoop是有正面回报的。Hadoop不仅继续为海量数据的清洗,存储,和处理提供一个集中的平台,它也解决了标准IT解决方案的费用过高的问题。Hadoop为很多类型的应用,如预测性分析,ETL,数据可视化,数据挖掘,数据仓库,物联网,或者点击流分析提供了杰出的解决方案。今天,Hadoop被认为是最受喜爱的单一、可缩放并且费用相对低廉的商业大数据管理系统的替代方案;2017年它的流行度会增加。


在2015-16年度,唯一限制Hadoop增长的是创收能力。但最终大数据技术的广泛性会打开Hadoop的利润市场,《2017-2022 Hadoop市场预测》(https://www.marketanalysis.com/?p=229)预测到2020年这个正在扩增的市场将超过160亿美元。


也可以参阅这个《Hadoop和大数据分析市场》的报告(http://www.marketsandmarkets.com/Market-Reports/hadoop-market-766.html),其中指明,这两个互相依赖的市场在2017年底将价值139亿美元。


2017数据科学预言5:数据科学在行动——健康产业商业智能和分析


富有洞见的《德勤研究报告》绘制了一副2020年基于高科技和数字化的病人照顾蓝图。由于科学技术如视频会议和可穿戴设备越来越普遍,未来精通科技的病人会逐步将他们的日常医疗需求诉诸数字平台。到2020年,医院和临床中心只会为重症病人和监护病人保留。

总体而言,将来的医疗健康产业会朝着数字化平台发展,而2017年,这种趋势将很明显。

 

2017年,消费者可以期待:

  • 医生们参考数据驱动的方案为病人做决策

  • 健康服务业逐步迈向4P”模式——“预防,预测,个体化,参与”( preventative, predictive, personalized, and participatory)。在这种模式下,病人成为全面知悉、共同参与评价和选择合适的治疗方法的伙伴。


2017数据预言6:到2017年底,25%的企业将招募首席数据官


2016大数据7大趋势》文章(http://www.edvancer.in/7-big-data-trends-2016/)的读者会发现,Gartner已经做出了上述预言。一个首席数据官,应该负责数据战略,数据治理,政策管理,也负责数据质量,隐私和安全,生命周期管理。这个趋势表明,要来的一年全球经济将经历完整的数据驱动的文化。首席数据官是推动部门内数据科学应用的主要力量,他们理解先进的分析之必须以及数据科学为企业所带来的诸多利益。


Readers may also find the article Predictions for Data Science over the Coming Years of interest.


感兴趣的读者可以参阅: http://www.dataversity.net/predictions-for-data-science-over-the-coming-years/


◆ 

这一切意味着什么?


斯科特•克拉克,一位Yelp的数据科学家,感受到了由于数据科学, Yelp网站所做出的些微改变将对“上百万的人”产生巨大影响。数据科学的这种高速性和准确性,只有在高速增长和联合使用相关技术,如大数据,Hadoop,物联网才成为可能,这些技术在2017年将继续发展。全球的商业人士终将理解来自互联网,手机,社交媒体和物联网的数据洪流的意义,2017年以至更远的将来,数据科学将有助于更好的理解这些趋势,助力数据管理业界整体的持续增长。

原文发布时间为:2016-11-07


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
阿里云AIoT物联网开发实战
本课程将由物联网专家带你熟悉阿里云AIoT物联网领域全套云产品,7天轻松搭建基于Arduino的端到端物联网场景应用。 开始学习前,请先开通下方两个云产品,让学习更流畅: IoT物联网平台:https://iot.console.aliyun.com/ LinkWAN物联网络管理平台:https://linkwan.console.aliyun.com/service-open
相关文章
|
4天前
|
数据采集 人工智能 安全
|
13天前
|
云安全 监控 安全
|
5天前
|
自然语言处理 API
万相 Wan2.6 全新升级发布!人人都能当导演的时代来了
通义万相2.6全新升级,支持文生图、图生视频、文生视频,打造电影级创作体验。智能分镜、角色扮演、音画同步,让创意一键成片,大众也能轻松制作高质量短视频。
1102 152
|
18天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
1776 9
|
10天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
708 152
|
12天前
|
人工智能 安全 前端开发
AgentScope Java v1.0 发布,让 Java 开发者轻松构建企业级 Agentic 应用
AgentScope 重磅发布 Java 版本,拥抱企业开发主流技术栈。
664 14
|
7天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
467 5