大数据科学认识与理解论坛全攻略

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

说到贵阳,你会想到什么?这里有文峰塔、阳明书院,然而毫无疑问,这两天这座城市拥有了一个别样的关键词:大数据。街道两旁的宣传广告随处可见。2016年5月25日,第一届大数据科学与工程国际会议——大数据科学认识与理解在贵阳召开。据说此前贵阳已阴雨连绵数日,而雨停,也许就是一种美好的昭示。

上午8:30,大会准时开始,清华大学教授,原中国计算机学会理事长郑纬民先生担任本次大会主持人。出席大会的嘉宾有:中国工信出版集团董事长,人民邮电出版社社长季仲华;

中国计算机学会大数据专家委员会秘书长,中国科学院计算机技术研究所研究员、所长助理、副总工程师程学旗;中国工程院院士邬贺铨;美国伊利诺伊大学芝加哥分校特聘主任教授,清华大学数据科学研究院院长,ACM/IEEE Fellow俞士纶;美国特拉华大学电子与集散机工程学院终身教授,ETI公司的创始人与首席科学家,ACM/EEE Fellow高光荣;英国帝国理工学院数据科学研究所终生教授/所长郭毅可;香港中文大学常务副校长,伟伦计算器科学与工程学讲座教授,ACM/EEE Fellow华云生;中国科学院院士,上海交通大学副校长,IEEE,Fellow梅宏。

贵阳市政协副主席孙袁为大会作为开场嘉宾发表致辞。她在现场表示:“此次数博会来自全国嘉宾和国际嘉宾预计达到2万人次,作为2016年的重磅学术活动,贵阳非常重视,我们要发展大数据,就应该对于大数据理念、内涵,关键数据以及人才培养的研究。我们希望本次会议在国家行业专家学者及全体人员的共同努力下,有效推动贵阳、贵州、中国乃至全球的大数据发展,为使我国走在大数据前端而共同努力奋斗。”

共八位专家在本场大会上分享了自己的观点,快和小编去现场看看,和大数据来一场“零距离”的接触吧!

邬贺铨:大数据总量巨大

大数据从结构上来看可以分成结构化、半结构化、非结构化。大数据是多来源的。大数据之大,这是全世界网民平均每个月上网的流量,2013年全球互联网流量每年为2.7EB,全年达到1ZB。2015年和2016年全世界新产生的数据量等于人类有历史以来一直累计到2014年全球数据重量的总和,量非常大。

高光荣:大数据系统软件前沿的几个开放问题

高性能并非计算的“又一春”,接着是高性能计算/大数据面临的挑战,既有挑战也有机遇。接着是大数据系统和软件,搞的开放问题。往往是你脑子里有一个思路,要怎么做。绝对不能忽悠,忽悠解决不了问题。二十五年以前认为计算机不用再发展了,已经很前沿了,但是现在这个观点已经不适用了。你想解决的问题,人工智能没有达到效果。二十五年以后情况不一样。山穷水尽无疑路,柳暗花明又一村,为什么这个事又活了?并非结构活了,并非数据活了,人工智能进入第二春。没有经过头一次死的人,现在看到的是第二次的出现。

俞士纶:对异构数据源的思考

把不同数据库联在一起,这些数据来自不同的领域,合并在一起的话,使我们能做更好的预测。现在是大数据时代,一个重要的事情是我们要怎么融合不同的数据?数据是很值钱的事情,其实IBM做气象预测,有不同的应用可以预测天气,根本赚不了什么钱。像运输路线怎么走的话,一定要知道天气,如果不知道天气的话,他可能开到一半,被大风吹走了,也可能会淹水。如果做奇货买卖的话一定要知道天气,比如这个地方有干旱、洪涝等等。像做农业的话也需要知道天气,天气这个数据可以应用在不同方面,知道这个数据可以改变很多细节。要了解到什么数据是很有意义的数据。

张晓东:大数据分析将对人类社会本身的了解达到前所未有的高度

算机是为网络研制的,互联网和无线上网是一个数据世界的基础。从1986年281PB,到2013年667EP,增加了2.9倍。这支持了我们的数据结构。计算机是一个数据中心,这个数据中心主要来源,这些数据,进去出来的数据相当多。所以从这个角度来讲,当数据量这么大,对我们数据处理有很多新的挑战。

郭毅可:数据科学与科学数据

我们知道科学研究有三个主要要素,理论、计算、实验。这三个理论是这样的,从理论出发,我们可以建立模型。对这个模型的模拟可以产生数据。我们理论至上,对事件进行假设,并进行观察,得到数据。我认为数据科学是当代科学的重要基础和方法论。实际上数据科学在当代的用处极其广泛,而且推动了许多技术的研究和发展。我们就是基于这个基础上做努力。

华云生:大数据研究的战略思考

数据特性的多样性,不同的应用有不同的特性,有些数据可能有规律的,有一些是没有规律的。他们的概念,表示方法也不一样,也有多样性。数据的目标也有多样性。数据的原因。不同的数据、不同的应用有不同的目标。算法的多样性,有不同的算法。基建的多样性,所以数据也有不同的地方。理论基础多样性。不像以前做做法有很好的规律、很好的算法。大数据其实是个现象。?现在从做大数据来讲,很多没有办法从一个应用上面找出一个规律,找出一个方法,很容易应用到其他应用上。

方滨兴:云监控与云加密——打造可信的云

云安全的四个层面,第一个是可靠的云,能够始终可靠地提供服务。安全云,保障用户及租户在云中不会因攻击而受到损害。可信云,保障云服务商不会对租户的运行进行侵害。客户把资料传到云上?怎么保障信息的安全?这是一个很大的问题。云加密,降低泄密风险。上网前把个人信息提交给网络才能上网,这叫上网实名制。不作为怎么办?我们能怎么办?无缝数据加密传输、支持任意云端平台。云监控,你不作为,不能乱作为,所以我要监督你,发现你是不是做了不该做的事情。

梅宏:对大数据热潮的若干反思

我们看到了很多数据应用的成功案例,在商业智能、在智能交通、在自然语言处理、在自动问答系统、下棋机器人等等。我想机器替代人做劳动、做体育、做计算到现在帮助人下棋,毫无疑问,还会继续往下走。在这个意义下,我们对大数据高度重视。大数据的应用仍处于初级发展阶段。现在的很多案例都很难被看作典型的大数据应用案例,很多都属于初级阶段。真正的大数据应用应该体现在数据挖掘的深度和多源(跨界)数据的融合的广度,绝不是数据的“海量”,这才是所谓的大数据。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
人工智能 分布式计算 大数据
超级计算与大数据:推动科学研究的发展
【9月更文挑战第30天】在信息时代,超级计算和大数据技术正成为推动科学研究的关键力量。超级计算凭借强大的计算能力,在尖端科研、国防军工等领域发挥重要作用;大数据技术则提供高效的数据处理工具,促进跨学科合作与创新。两者融合不仅提升了数据处理效率,还推动了人工智能、生物科学等领域的快速发展。未来,随着技术进步和跨学科合作的加深,超级计算与大数据将在科学研究中扮演更加重要的角色。
|
存储 数据采集 机器学习/深度学习
什么是科学问题,大数据考试题
什么是科学问题,大数据考试题
103 2
什么是科学问题,大数据考试题
|
数据采集 SQL 存储
数据引力,数据倾斜,数据距离,大数据科学
本文主要内容是介绍教育大数据的定义与作用,在了解教育大数据前我们首先要了解什么是大数据。大数据技术是21世纪最具时代标志的技术之一。国务院发布的《促进大数据发展行动纲要》中提出“大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合”。简单的说,大数据就是将海量碎片化的信息数据能够及时地进行筛选、分析,并最终归纳、整理出我们需要的资讯。
214 2
数据引力,数据倾斜,数据距离,大数据科学
|
数据可视化 大数据 索引
|
人工智能 自然语言处理 大数据
贵阳数博会分论坛:人工智能遇上大数据
此次「人工智能遇上大数据」论坛由两部分构成,主题演讲和话题讨论。覆盖产、学、研三界的国内外嘉宾,在主题演讲环节分别分享了各自所在领域对人工智能、大数据的认识。
223 0
贵阳数博会分论坛:人工智能遇上大数据
|
人工智能 物联网 大数据
云栖科技评论第60期:云、大数据与AI:大科学时代的“三剑客”
简单一句话:数据是介质,云是协作平台,AI是知识发现的助力。有趣的是,随着支持大科学时代的大尺度问题的解决,不断面对大规模数据计算与存储、大范围协作平台以及深层次知识发现等问题的云与AI,也将得到“反哺”,得以实现“高维”学习,持续提高其功能与能力。
3604 0
|
机器学习/深度学习 人工智能 数据可视化