活动实践 | DataWorks智能交互式数据开发与分析之旅

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
大数据开发治理平台DataWorks,Serverless资源组抵扣包300CU*H
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本指南介绍了如何使用阿里云平台进行大数据开发与分析。首先,在MaxCompute控制台创建项目并配置计算资源;接着,通过DataWorks控制台创建工作空间和独享资源组,并绑定工作空间。然后,创建个人开发环境,载入案例并新建Notebook实例。在Notebook中,通过SQL和Python Cell进行交互式开发和数据分析,体验智能助手Copilot的功能,如SQL改写、解释、生成注释及智能建表。最后,清理所有创建的资源,包括删除DataWorks资源、MaxCompute项目及网络配置,确保环境整洁。

1、进入MaxCompute控制台。

在左侧导航栏选择项目管理,地域选择为华东2(上海),单击新建项目。在新增项目对话框中输入项目名称,计算资源付费类型选择按量付费,默认Quta可根据自身情况选择(本场景使用的是开通MaxCompute时自动购买的os_默认后付费Quota_p),单击确定。

image.png

2、进入DataWorks产品控制台。

在左侧导航栏中,单击工作空间 > 创建工作空间
image.png

在左侧导航栏中,单击资源组 > 独享资源组 > 新建资源组。

image.png

image.png

在绑定工作空间页面,找到目标工作空间单击右侧的绑定。
image.png

3、创建个人开发环境

在左侧导航栏选择大数据体验 > DataWorks Gallery,单击DataWorks Notebook快速入门的载入案例。
image.png
在载入案例对话框中,选择刚刚创建的工作空间。在实例下拉框中,单击创建实例。

image.png

在新建实例页面,创建个人开发环境实例,设置实例名称,并选择刚刚创建的资源组,设定资源配额,最小2CU即可满足实验要求。
image.png

image.png

返回大数据体验 > DataWorks Gallery页面,在载入案例对话框中,选择刚刚创建的工作空间和实例,单击确认后进入个人开发空间。
image.png

新建Notebook。
image.png

image.png

4、以MaxCompute为例进行交互式开发

单击SQL,在弹出的SQL Cell中选择您想运行的大数据引擎,本场景以MaxCompute为例。
image.png
运行前需要选择计算资源,可单击SQL Cell右侧的请选择计算资源 > +绑定计算资源。
image.png

在绑定计算资源面板,单击绑定计算资源,选择MaxCompute。
image.png

image.png

创建成功后如下图所示。
image.png

返回Notebook文件编辑页,输入如下命令后,单击执行按钮。
image.png

5、使用Python进行数据分析

在Notebook中,能够新增Python Cell,编写Python代码进行数据处理和开发等。

单击+Python,唤出Python Cell。
image.png

在Python Cell中输入示例代码,单击执行按钮。
image.png

交互式分析。在Notebook中,您可以使用Python封装ipywidgets交互组件,并在SQL中引用该交互组件的变量,以实现灵活的交互式查询。

image.png

7、体验智能助手Copilot

SQL改写。在代码编辑器中,输⼊并选中下面的代码,单击顶部菜单栏右侧的Copilot,进⼊Copilot Chat功能界⾯,在Chat输⼊框中,输⼊您的改写要求,单击发送,等待Copilot返回结果。
image.png

SQL解释。在代码编辑器中,输⼊并选中下面的代码,单击顶部菜单栏右侧的Copilot,进⼊Copilot Chat功能界⾯,在Chat输⼊框中,输⼊您的改写要求,单击发送,等待Copilot返回结果。

image.png

生成注释。在代码编辑器中,输⼊并选中下面的代码,右击选择Copilot > 生成注释,进⼊Copilot Chat功能界⾯,在Chat输⼊框中,输⼊您的改写要求,单击image发送,等待Copilot返回结果。

image.png

智能建表。在Data Studio⻚⾯,单击左侧⼀级菜单栏中的数据⽬录,在数据⽬录列表中,选择任意⼀个数据⽬录,右键新建 > 新建表。进⼊新建表的功能界⾯,单击页面顶部中的Copilot建表,进⼊Copilot建表功能界⾯。在输⼊框中,输⼊您的指令如会员注册信息表,单击生成并替换,等待Copilot返回结果。
image.png
image.png

8、清理资源

删除Datawork资源组和工作空间。

image.png
image.png
image.png
image.png

删除MaxCompute项目。
image.png
image.png

删除VPC及交换机。
image.png
image.png

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
18天前
|
数据采集 DataWorks 大数据
开发者评测:DataWorks — 数据处理与分析的最佳实践与体验
阿里云DataWorks是一款集成化的大数据开发治理平台,支持从数据导入、清洗、分析到报告生成的全流程自动化。通过用户画像分析实践,验证了其高效的数据处理能力。DataWorks在电商和广告数据处理中表现出色,提供了强大的任务调度、数据质量监控和团队协作功能。相比其他工具,DataWorks易用性高,与阿里云服务集成紧密,但在API支持和成本优化方面有待提升。总体而言,DataWorks为企业提供了强有力的数据开发和治理支持,尤其适合有阿里云生态需求的团队。
97 17
|
20天前
|
SQL 分布式计算 DataWorks
DataWorks智能交互式数据开发与分析之旅
本次实验将带您进行DataWorks Notebook的快速入门,包含:Notebook新建、多引擎SQL开发与分析、Python开发、交互式分析等,同时,使用DataWorks Copilot体验智能数据开发,体验智能交互式数据探索之旅。
|
30天前
|
SQL DataWorks 搜索推荐
DataWorks产品评测与最佳实践体验报告
DataWorks是阿里巴巴云推出的一款高效数据处理平台,通过内置的数据集成工具和ETL功能,实现了多源数据的自动化处理与分析。本文介绍了DataWorks在用户画像分析中的应用实践,展示了其如何帮助企业高效管理数据资源,支持决策制定及营销优化。同时,文章还评测了DataWorks的产品体验,包括开通流程、功能满足度等方面,并与其它数据开发平台进行了比较,突出了DataWorks在易用性、性能和生态完整性上的优势。最后,对Data Studio新版本中的Notebook环境进行了初步探索,强调了其在提升开发效率方面的价值。
64 16
|
1月前
|
机器学习/深度学习 数据采集 DataWorks
DataWorks产品评测:数据处理与分析的最佳实践
DataWorks是阿里巴巴推出的大数据开发治理平台,支持从数据采集、预处理、存储到分析的全流程操作。本文评测了其在用户画像分析中的应用,包括数据收集、清洗、特征工程、模型训练、结果评估及应用部署等步骤,展示了其在提高数据资产管理效率、支持多种编程语言和技术栈、集成丰富可视化工具等方面的优势。同时,文章也指出了DataWorks在使用过程中的一些不便与问题,并提出了改进建议。
65 17
|
30天前
|
数据采集 DataWorks 搜索推荐
阿里云DataWorks深度评测:实战视角下的全方位解析
在数字化转型的大潮中,高效的数据处理与分析成为企业竞争的关键。本文深入评测阿里云DataWorks,从用户画像分析最佳实践、产品体验、与竞品对比及Data Studio公测体验等多角度,全面解析其功能优势与优化空间,为企业提供宝贵参考。
109 13
|
30天前
|
分布式计算 DataWorks 大数据
DataWorks产品体验评测报告
DataWorks产品体验评测报告
55 8
|
1月前
|
SQL DataWorks 搜索推荐
DataWorks 产品评测:数据处理的最佳实践与体验
DataWorks是阿里巴巴云推出的一款综合型大数据开发治理平台,通过此次用户画像分析实践,展现了其在数据整合、分析及可视化方面的强大能力。该平台支持自动化ETL流程,优化了数据资产管理与决策支持,提升了跨部门协作效率,促进了业务创新。相比其他工具,DataWorks具备全面的服务生态、高性能计算能力和高智能化水平,尤其适用于处理大规模数据集。新版Data Studio进一步增强了用户体验,集成了Notebook环境与智能助手Copilot,大幅提高了开发效率。尽管存在一些小问题,但整体上,DataWorks是企业实现数字化转型的理想选择。
58 8
|
26天前
|
机器学习/深度学习 存储 数据采集
解锁DataWorks:一站式大数据治理神器
解锁DataWorks:一站式大数据治理神器
48 1
|
1月前
|
数据采集 DataWorks 搜索推荐
DataWorks产品评测:数据处理最佳实践与平台体验
DataWorks产品评测:数据处理最佳实践与平台体验
57 8
|
1月前
|
DataWorks 数据可视化 搜索推荐
DataWorks产品体验与评测报告
DataWorks是一款全面的大数据开发治理平台,通过最佳实践测评,展示了其在用户画像分析、数据管理和开发效率提升等方面的强大功能。体验过程中,虽遇到开通流程繁琐、文档不足等问题,但整体功能满足预期。建议增强实时数据处理能力和数据可视化功能,以进一步提升用户体验。与同类工具相比,DataWorks在功能全面性、性能和开放性上表现突出,但也需优化界面设计和价格策略。新版Data Studio中的Notebook和智能助手Copilot提供了优秀的交互式编程和智能辅助,但仍需改善稳定性和集成度。