MVP学院大数据专场之我见(上)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 5月24 号在北京阿里中心举行了一次MVP学院的大数据专场活动,邀请了阿里云和优酷的技术专家进行了三场主题演讲,其中有些内容令我印象深刻,晒出来供大家参考。

5月24 号在北京阿里中心举行了一次MVP学院的大数据专场活动,邀请了阿里云和优酷的技术专家进行了三场主题演讲,其中有些内容令我印象深刻,晒出来供大家参考。

用AI来管理大数据

像阿里巴巴这个体量的公司,数据人才也是稀缺资源。假如用人肉的方式来管理和分析数据,一个分析师撑死能能管理上百个作业,服务几十人的业务团队。而假如用AI来辅助管理和分析数据,一个分析师能够轻松管理上万个作业,服务上千人的业务团队。
不仅阿里巴巴集团自用的大数据平台在拥抱AI,在阿里云对外输出的的Dataphin智能数据构建与管理平台中,数据的连接和统一ID的萃取、数据分析代码的生成、模型的和算法的优化都可以自动的完成。

构建技术生态

在会上,曾经在微软工作过的阿里云研究员结合自己的经历提出了一个技术解决方案四个阶段的理论:

  • 第一阶段、基于业界有影响力的方案解决自身的问题,阿里巴巴最初的大数据计算是基于Oracle的,在Oracle无法满足需求后分别切换到了GreenPlum和Hadoop,这些都是业界有影响力的方案。随着业务的发展,这些方案都遇到了天花板,于是阿里巴巴开始进行自研系统的开发,在微软、Google都有类似的情况。
  • 第二阶段、自研核心系统,阿里巴巴开始自研大数据平台ODPS,从2010年开始在阿里巴巴集团内部使用。
  • 第三阶段、自研核心系统的对外输出,ODPS从2013年开始对外提供商业服务,2016年ODPS2.0发布,并将对外的名字改为MaxCompute。
  • 第四阶段、建立广泛生态、以MaxCompute为基础,流计算平台BLink、机器学习平台PAI、大数据开发平台DataWorks、数据智能产品QuickBI、数据可视化DataV等平台和产品不断扩展阿里云大数据解决方案的适用领域。今天的阿里云大数据解决方案就是一个小核心加一个大外围组成的。

数据本身并不产生价值,计算才能产生价值

阿里的研究员在谈到数据湖的时候表达了两条个人观点:
数据本身并不产生价值,计算才能产生价值。
自从大数据这个概念火起来之后,各种大数据平台建的多成功的少,问题可能就出在这个地方,将数据存储起来并不能产生价值,只有针对这些数据的挖掘和计算才能产生价值,数据存储在哪里并不是核心问题,因此才有:
计算的下推比数据的上报能够更加高效的获取价值。
这么看物理的数据湖可能有些问题,但逻辑的数据湖是有价值的,阿里云的数据湖解决方案就是通过统一的管理分散在各种存储介质上的数据以及统一分配和调度计算工作来实现逻辑数据湖的。
限于个人时间和精力,这次就分享这么多,下次给大家分享大数据平台最佳实践相关的内容。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
大数据
【内含分享PPT/视频/文章】阿里云MVP学院MaxCompute技术闭门会线上首播 | 2019大数据技术公开课第二季
数据的价值是解释业务还是预测业务?是支撑业务还是驱动业务?企业级计算服务的核心问题是什么?企业级计算平台要解决的核心问题是什么?商业和技术的平衡点在哪里? 一起直播学习,让数据真正驱动业务。
13503 0
【内含分享PPT/视频/文章】阿里云MVP学院MaxCompute技术闭门会线上首播 | 2019大数据技术公开课第二季
|
机器学习/深度学习 人工智能 分布式计算
坚信大数据的变革力量——对话阿里云 MVP田亮
我和田亮的交流耗时较久,甚至用上了他出差的所有碎片时间,而他的回答始终谨慎、认真、高效。历任搜狐、阿里巴巴、新浪微博,10年如一日始终深耕大数据领域,阿里云 MVP田亮能在百舸争流中成为大数据和人工智能领域的佼佼者,似乎也就不奇怪了。
坚信大数据的变革力量——对话阿里云 MVP田亮
|
分布式计算 安全 数据可视化
6位技术大咖11月倾心巨献,大数据+安全主题的技术分享合集【阿里云MVP 干货集锦】
大家好,阿里云 MVP 11月大数据+安全主题分享新鲜出炉,快来一睹为快吧!哪些MVP的分享最吸引你,你最想支持哪个MVP? 我们将开启为期一周的最人气内容评选,我们将在MVP评论内容下抽取评论最佳赠送公仔抱枕一只!并有机会受邀参加阿里云粉丝活动
3050 0
|
大数据
MVP 学院大数据专场之我见(下)
阿里云大数据最佳实践相关内容
968 0
|
分布式计算 大数据 BI
阿里云MVP田亮:让大数据为业务插上翅膀
从搜狐到阿里,再到微博和二次元社交平台,看一位大数据工作者走过的技术路
10409 0
|
存储 分布式计算 大数据
看完这些干货帖,大数据产品从入门到精通|MVP讲堂
看完这些干货帖,了解大数据产品应用场景
1973 0
|
存储 监控 数据可视化
阿里云MVP Tech Show第10期大数据之美
6月23日,阿里云在厦门举办了第十期阿里云MVP Tech Show,本次活动也是宏网信息与阿里云签署MVP项目城市合作伙伴协议之后的首次线下沙龙活动,活动主题是“大数据之美”。随着社会信息化的高速增长,各行各业每时每刻产生着大量的数据,这些数据如何去合理的存储与展现,是很多企业面临的问题,本期MVP Tech Show邀请了厦门点触科技股份有限公司研发经理上官成与美柚大数据专家李庆勇两位阿里云MVP为大家进行数据可视化与数仓建模最佳实践分享。
1607 0
|
24天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
196 7