说到贵阳,你会想到什么?这里有文峰塔、阳明书院,然而毫无疑问,这两天这座城市拥有了一个别样的关键词:大数据。街道两旁的宣传广告随处可见。2016年5月25日,第一届大数据科学与工程国际会议——大数据科学认识与理解在贵阳召开。据说此前贵阳已阴雨连绵数日,而雨停,也许就是一种美好的昭示。
上午8:30,大会准时开始,清华大学教授,原中国计算机学会理事长郑纬民先生担任本次大会主持人。出席大会的嘉宾有:中国工信出版集团董事长,人民邮电出版社社长季仲华;
中国计算机学会大数据专家委员会秘书长,中国科学院计算机技术研究所研究员、所长助理、副总工程师程学旗;中国工程院院士邬贺铨;美国伊利诺伊大学芝加哥分校特聘主任教授,清华大学数据科学研究院院长,ACM/IEEE Fellow俞士纶;美国特拉华大学电子与集散机工程学院终身教授,ETI公司的创始人与首席科学家,ACM/EEE Fellow高光荣;英国帝国理工学院数据科学研究所终生教授/所长郭毅可;香港中文大学常务副校长,伟伦计算器科学与工程学讲座教授,ACM/EEE Fellow华云生;中国科学院院士,上海交通大学副校长,IEEE,Fellow梅宏。
贵阳市政协副主席孙袁为大会作为开场嘉宾发表致辞。她在现场表示:“此次数博会来自全国嘉宾和国际嘉宾预计达到2万人次,作为2016年的重磅学术活动,贵阳非常重视,我们要发展大数据,就应该对于大数据理念、内涵,关键数据以及人才培养的研究。我们希望本次会议在国家行业专家学者及全体人员的共同努力下,有效推动贵阳、贵州、中国乃至全球的大数据发展,为使我国走在大数据前端而共同努力奋斗。”
共八位专家在本场大会上分享了自己的观点,快和小编去现场看看,和大数据来一场“零距离”的接触吧!
邬贺铨:大数据总量巨大
大数据从结构上来看可以分成结构化、半结构化、非结构化。大数据是多来源的。大数据之大,这是全世界网民平均每个月上网的流量,2013年全球互联网流量每年为2.7EB,全年达到1ZB。2015年和2016年全世界新产生的数据量等于人类有历史以来一直累计到2014年全球数据重量的总和,量非常大。
高光荣:大数据系统软件前沿的几个开放问题
高性能并非计算的“又一春”,接着是高性能计算/大数据面临的挑战,既有挑战也有机遇。接着是大数据系统和软件,搞的开放问题。往往是你脑子里有一个思路,要怎么做。绝对不能忽悠,忽悠解决不了问题。二十五年以前认为计算机不用再发展了,已经很前沿了,但是现在这个观点已经不适用了。你想解决的问题,人工智能没有达到效果。二十五年以后情况不一样。山穷水尽无疑路,柳暗花明又一村,为什么这个事又活了?并非结构活了,并非数据活了,人工智能进入第二春。没有经过头一次死的人,现在看到的是第二次的出现。
俞士纶:对异构数据源的思考
把不同数据库联在一起,这些数据来自不同的领域,合并在一起的话,使我们能做更好的预测。现在是大数据时代,一个重要的事情是我们要怎么融合不同的数据?数据是很值钱的事情,其实IBM做气象预测,有不同的应用可以预测天气,根本赚不了什么钱。像运输路线怎么走的话,一定要知道天气,如果不知道天气的话,他可能开到一半,被大风吹走了,也可能会淹水。如果做奇货买卖的话一定要知道天气,比如这个地方有干旱、洪涝等等。像做农业的话也需要知道天气,天气这个数据可以应用在不同方面,知道这个数据可以改变很多细节。要了解到什么数据是很有意义的数据。
张晓东:大数据分析将对人类社会本身的了解达到前所未有的高度
算机是为网络研制的,互联网和无线上网是一个数据世界的基础。从1986年281PB,到2013年667EP,增加了2.9倍。这支持了我们的数据结构。计算机是一个数据中心,这个数据中心主要来源,这些数据,进去出来的数据相当多。所以从这个角度来讲,当数据量这么大,对我们数据处理有很多新的挑战。
郭毅可:数据科学与科学数据
我们知道科学研究有三个主要要素,理论、计算、实验。这三个理论是这样的,从理论出发,我们可以建立模型。对这个模型的模拟可以产生数据。我们理论至上,对事件进行假设,并进行观察,得到数据。我认为数据科学是当代科学的重要基础和方法论。实际上数据科学在当代的用处极其广泛,而且推动了许多技术的研究和发展。我们就是基于这个基础上做努力。
华云生:大数据研究的战略思考
数据特性的多样性,不同的应用有不同的特性,有些数据可能有规律的,有一些是没有规律的。他们的概念,表示方法也不一样,也有多样性。数据的目标也有多样性。数据的原因。不同的数据、不同的应用有不同的目标。算法的多样性,有不同的算法。基建的多样性,所以数据也有不同的地方。理论基础多样性。不像以前做做法有很好的规律、很好的算法。大数据其实是个现象。?现在从做大数据来讲,很多没有办法从一个应用上面找出一个规律,找出一个方法,很容易应用到其他应用上。
方滨兴:云监控与云加密——打造可信的云
云安全的四个层面,第一个是可靠的云,能够始终可靠地提供服务。安全云,保障用户及租户在云中不会因攻击而受到损害。可信云,保障云服务商不会对租户的运行进行侵害。客户把资料传到云上?怎么保障信息的安全?这是一个很大的问题。云加密,降低泄密风险。上网前把个人信息提交给网络才能上网,这叫上网实名制。不作为怎么办?我们能怎么办?无缝数据加密传输、支持任意云端平台。云监控,你不作为,不能乱作为,所以我要监督你,发现你是不是做了不该做的事情。
梅宏:对大数据热潮的若干反思
我们看到了很多数据应用的成功案例,在商业智能、在智能交通、在自然语言处理、在自动问答系统、下棋机器人等等。我想机器替代人做劳动、做体育、做计算到现在帮助人下棋,毫无疑问,还会继续往下走。在这个意义下,我们对大数据高度重视。大数据的应用仍处于初级发展阶段。现在的很多案例都很难被看作典型的大数据应用案例,很多都属于初级阶段。真正的大数据应用应该体现在数据挖掘的深度和多源(跨界)数据的融合的广度,绝不是数据的“海量”,这才是所谓的大数据。
本文转自d1net(转载)