对话周涛:抓住大数据最性感的方向

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

摘要“大数据行业领军人”、“数据少帅”、“最年轻教授”,80后教授周涛身上有太多让人惊艳的标签,大数据文摘【思享者】有幸专访了这位大数据行业的传奇人物,褪去主角光环,周涛对中国的大数据生态、大数据行业的创业风向、以及如何培养下一代的大数据思维都给出了有趣的建议。


关于周涛:博士,教授,电子科技大学互联网科学中心主任。电子科技大学特聘教授,四川省最年轻的教授,主要研究方向为复杂性科学、网络科学、信息物理、人类动力学和群集动力学。参与撰写专著5册,发表论文180余篇,其中130余篇为SCI检索论文。全国第一支大数据产业股权基金“大数据实验室孵化基金”创始合伙人、全国最大的数据挖掘竞赛平台Data Castle创始人。



一副黑框眼镜、一件印着“UESTC”的绿色T恤、好脾气的接受所有“粉丝”合照签名的要求,你很难想象,眼前这个清瘦的80后就是在中国大数据生态链中拥有着不可取代位置的周涛。

 

就在上个月,厦华电子发布重组预案,合计作价18亿元收购成都数联铭品科技有限公司(简称“数联铭品”)100%股权。而周涛作为数联铭品首席科学家,持股价值达到1.92亿元。

 

520这天,大数据文摘在“湛庐文化”见到了《为数据而生》的作者、被称为“数据少帅”、“中国大数据行业领军人”的周涛。

 

在接下来的一个小时,这位年轻的数据科学家向大数据文摘娓娓道来了中国的数据生态、创业环境和大数据思维的培养。

 

大数据文摘截取了专访过程中最精华的部分,做成音频分享给各位读者,为还原真实的现场,录音只经过了简单的处理,仔细听的话您甚至还可以听到周涛聊到激动之时拍桌子的声音和不羁的笑声。

 

周涛专访  - 来自大数据文摘
00:00 / 17:07


◆ ◆ 

“中国的大数据时代还没有真正到来”

 

4年前,周涛作为主要译者参与翻译了《大数据时代》这本书,销量百万,成为了当时很多中国人了解大数据这个概念的伊始,也为大数据这个概念的热度加了一把火。而在《大数据时代》出版后第四年,周涛认为,中国的大数据时代依然还没有真正到来。

 

“五年前,可能大家对大数据更乐观,认为大数据会带来很多产业上的变化,但是这样的变化并没有到来”,周涛认为,有这么几个方面制约了大数据时代的到来。

 

首先,拥有大数据的一方、拥有核心技术的一方和拥有人才的一方,这三方是分离的。数据的整个流通并没有真正的实现。“有最好数据的包括政府、银行、运营商、医疗机构,他们有很有价值的数据,但是即使是不敏感的数据,他们也缺乏一种安全有效的办法把它们开放出来,敏感的数据更是缺乏一种分权限安全的办法把它们开放出来,使得一些有需求的人享受价值。”

 

所以从这种意义上讲,好的数据无法发挥价值,或者只是在产生它的地方发挥一定的价值。而周涛定义的真正的大数据时代下,一组有价值的数据可以被扭转了十几二十次,在很多地方都发挥价值,而这离不开数据安全有效的开放。

 

周涛在新作《为数据而生》中,专门用一个章节讲中国数据开放,他认为,政府和公司在数据开放中都应该遵循以下三

 

首先从顶层来讲,在有容错的前提下,对数据开放做出立法规定。在类似贵州大数据综合试验区或者中关村自贸区这样比较灵活的区域多做一些尝试,允许有一些弯路;

 

第二个是在做这样的事情的时候要有一些方法论做指导。大企业或者地方政府首先要知道自己有哪些数据资源,了解每一个数据的完备性、一致性、更新频度、噪音等等。在此基础上制定自己的数据标准,这样内部可以共融共通,对外可以使别人理解你的数据。在这个标准下才谈得上如何开放数据。

 

最后,任何的数据开放都应该遵守“由易向难”、“增量优先”和“示范应用引导”这三个原则。

 

比如政府部门里的公安、卫纪、人社等部门的数据是较难开放的,交通、城市规划是比较容易开放的,那么先做容易的,由易向难完成开放过程。打破从前的条条框框是比较难的,所以一定是增量优先。而“示范应用引导”是指先通过某些项目,让大家看到了小范围数据开放的效果,可以带动更大范围的数据开放。

 

 

◆ ◆ 

“中国目前还有一百万到两百万的数据人才缺口”

 

周涛是中国最大的数据挖掘竞赛平台Data Castle创始人,他希望通过这个平台汇聚一批对大数据真正感兴趣的人才,而大数据人才的培养将是中国发展大数据生态的关键。

 

“整个(中国的)大数据产业链,不仅仅是高端人才,还包括很多初级人才,特别是对数据的采集、管理、运维方面的人才,还有很大的缺口。如果把这些算在一起,我们曾经粗略估计过中国大概有100-200万的数据人才缺口。”

 

周涛提出了两个途径来弥补中国的大数据人才缺口:

 

首先,进一步在垂直方向进行优质的培训,这种培训不是一个学位教育,通过一两个月的培训就足够把有一定计算机基础的专科生培养成为具备数据采集和运维能力的专门人才。

 

其次,在学校要有系统性的学位性教育,在二本、三本和专科学校(把数据教育)和当前的市场需求相结合,这样可以很快产生一批这样的人才。

 

尽管如此,如此大的数据人才缺口,尤其是在数据安全、管理、爬取方面的人才短缺情况,在短期内甚至两年到四年的时间,都很难弥补。

 

 

◆ ◆ 

“大数据创业要找到大数据最性感的方向”

 

除了学者和数据科学家的身份,周涛还是一位资深创客,就在上个月,周涛作为国信优易的创始人,在创客小镇——成都菁蓉镇向中共中央政治局常委、国务院总理李克强进行了专题汇报。

 

对于中国的创业环境,周涛认为中国有自己不可被替代的优势。首先在政府支持下,创业已经变成一种显文化,其次,中国拥有数量庞大的风险投资资金和庞大的市场,这些都是其他国家无法复制的。然而,如同培养一个贵族需要两代三代人,一个社会创新精神的培养也是如此,创新精神想要渗透到身体里还是需要几代人的努力。

 

周涛也给大数据行业的创业者们提出了几个建议:

 

首先,技术上的核心能力比商业模式创新重要,商业模式创新在今天很容易被泡沫冲垮;

 

其次,找到大数据和行业的深度结合点。这种结合最好不止是请几个行业专家加入,而是你所在的行业你的人有一种行业内本身的壁垒和垄断;

 

最后,紧跟大数据最性感的方向和国家战略方向。周涛认为大数据有两个最性感的方向,第一个就是数据的交易,它是纯粹大数据,一种新模式,交易就包括数据的版权、数据的价值评估、数据的定价等等;第二是大数据和医疗、金融的结合,因为这两个行业足够大,很性感;而站在国家战略的方向是指从GDP的角度来讲,我们需要看到中部西部的开放特别是航空和陆上,尤其是铁路的发展,比如一带一路战略,是非常重要的。大数据发展也要主动和国家的重大战略靠近。

 

◆ ◆ 

“大数据思维的培养从娃娃抓起”

 

周涛对于大数据思维的培养和教育也有自己的一套心得。

 

周涛认为大数据思维首先是数据思维,也就是逻辑思维能力和定量化。有逻辑能力可以知道做完一件事是可行的哪个点是有问题的,而定量化包括人们在描述一个事情的时候是定量的,也包括验证一件事情的时候是定量的。

 

单讲大数据思维,它强调高度关联,以前数据量很小的时候,往往用业务产生的数据解决业务本身。比如现在在探讨一个人的健康的时候,我们可以从他的出行轨迹、使用手机的习惯、父母的健康情况、经济情况都可以影响其身心健康,这样关联的看万事万物,不再把事物的因果看的很孤立,这也是很典型的大数据思维。

 

站在更学科性的角度讲,周涛把大数据思维归结为来自两个学科,一个是统计学,一个是计算机科学里的机器学习和人工智能。统计学就是这种定量化、逻辑化,分辨什么是关联什么是因果,机器学习和人工智能做大规模的非因果的关联,另外讲究预测性,预测是大数据的核心,这些因素共同组成了大数据思维。

 

周涛因此建议希望走上大数据这条路的读者增加机器学习和统计方面的知识:

 

第一是了解机器学习相关概念,读这方面的书,比如Bishop、周志华的书,有机器学习方面的概念;

第二是一定要有统计学的概念,知道哪些统计是对的哪些统计是错的,了解置信区间等等这些概念。

 

周涛认为,大数据思维的培养可以从娃娃抓起:“我觉得对于培养小孩子,有几个点比较重要,第一个是要培养小孩子集中注意力的能力,能不能自我控制集中注意力,延迟享乐,比如学下棋、做数学题看书,集中精力做一件事,这样对未来会有帮助。对于大数据思维的培养,并不在于做多少数学题,但是可以让他理解世界是有因果的,理解了因果才有逻辑。比如限制供给,付出努力才能得到,做什么样的事情可以得到什么后果。”

 

 

◆ ◆ 

结语

 

“什么是青春,青春就是把所有力量都集中起来去做一件触动自己灵魂的事情。”

 

如果以周涛自己所说的这条标准去判断,那么而立之年的他依然在抓紧时间极致地体验青春。

 

那么该如何“为数据而生呢?”周涛如此总结自己正为之奋斗的事业和还年轻的人生,本文也以此做结吧:

 

“我认为最重要的事情,从我个人执行层面来说,是创造和传播知识,努力提高下一代人的品位和格局;而从长远来讲,社会上一代一代人最重要的只有两件事,理解宇宙和生命的诞生,还有,消除暴力和贫穷。”

  

最后,点击视频查看周涛给大数据文摘读者的悄悄话: 


  


*【思享者】栏目招募志愿者*


思之,分享之,所谓【思享】也。而我们想做的,就是把真正的思想分享出去,我们叫自己【思享者】。大数据文摘【思享者】栏目专注对话大数据行业最有思想的人物,记录并传递最in的数据干货,分享对时下数据形式问题的态度。


我们希望通过对采访现场的文字、音频、视频还原,让您身临其境地仿佛面对面一样对话大咖,真正看到每一位数据家鲜明的个性和真正想传达的想法。


如果你也喜欢和有趣、有料、有深度的人聊天对话 ;

如果你也想要和大数据文摘一起把更多大数据深度思想分享给全世界;

如果你善于用文字、视频、音频的方式表达想法,

点击文末【阅读原文】加入大数据文摘【思享者】,成为数据大咖访问团志愿者中的一员,和我们一起对话大咖、分享思想。

原文发布时间为:2016-05-25

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
开发者 PHP 关系型数据库
对话驻云创始人 | 七问技术创业者(二):云计算、大数据,你要掌握底层技术,还是会用就够了?
上海驻云信息科技有限公司创始人蒋烁淼,马云湖畔大学第一期学员,公认的“湖畔第一大脑”,在云计算领域深耕多年,曾在阿里云成立之初为其提出开发建议。创业6年,和大家一起交流。
7146 0