《交互式分析六脉神剑》之Dataworks-HoloStudio初体验

本文涉及的产品
大数据开发治理平台DataWorks,Serverless资源组抵扣包300CU*H
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: HoloStudio是基于交互式分析的一站式开发平台,深度集成于DataWorks,除了提供可视化UI一键建表外,还支持纯SQL语言编写,也提供终端功能,像使用psql客户端一样使用HoloStudio来开发交互式分析,方便快捷,灵活巧妙,满足不同用户的不同开发习惯。

大家好,今天为大家带来《交互式分析六脉神剑》第二剑商阳剑之HoloStudio,第一剑少商剑传送门:5分钟学会交互式分析?!
金庸武侠中六脉神剑中的商阳剑是指右手食 指—太阳—小肠经—商阳剑,其特点是巧妙灵活,难以捉摸,正好完美对应DataWorks-HoloStudio。
在使用开发工具(比如psql客户端、JDBC等)连接交互式分析进行数据开发时,有些朋友就会有一些小困惑:
1.我想用更多时间去研究数据背后的意义,不想天天写代码建表写数据,有什么办法能让我不写那么多SQL,解放我的双手吗?
2.我们业务组基于DataWorks开发数据,需要用到数据调度、数据服务等功能,如果使用客户端连接交互式分析进行数据开发,好像不是特别方便。
......
正是基于此,我们自研了HoloStudio开发平台来完美解决以上所有的困惑。

HoloStudio是基于交互式分析的一站式开发平台,深度集成于DataWorks,除了提供可视化UI一键建表外,还支持纯SQL语言编写,也提供终端功能,像使用psql客户端一样就能使用HoloStudio来开发交互式分析,方便快捷,灵活巧妙,满足不同用户的不同开发习惯。更精妙的是,还能直接对接DataWorks的各项功能,如数据集成、数据服务等,无需数据迁移、无需多平台交互,轻轻松松能玩转大数据生态。
下面小编将会为大家系统的介绍HoloStudio的开通以及基本功能使用。

开通

前提条件:已成功开通交互式分析示例,详见:开通实例

绑定工作空间

在使用HoloStudio之前,需要将实例绑定至DataWorks的工作空间

  • 若已有DataWorks工作空间,单击小扳手--工作空间配置--交互式分析--增加实例,将购买好的实例信息填写进去即可。
    image
  • 若无工作空间,需要在管控台创建工作空间,根据项目情况选择是否同时开通其他计算引擎
    image

HoloStudio初体验

绑定完工作空间后,即可使用HoloStudio进行数据开发了。下面给大家一一介绍HoloStudio各个模块的功能。

1.SQL Console

SQL Console模块提供SQL编辑功能,不同于传统psql客户端的是,在SQL语句编写完之后,支持直接全部语句同时执行,也可以单独执行某条语句,并将执行结果进行可视化,同时也支持运行暂停,代码修改等功能,您只需为代码复杂,执行的事交给SQL Console就行。示例如下:
image

2.PG管理

PG管理主要是帮助大家进行UI可视化建表或者外部表,无需编写SQL,一键就能建表,完美解放双手。
- 内部表
在HoloStudio里创建一张内部表,您只需要输入表的字段,下面会自动生成SQL语句,方便您随时检查对照,同时还支持设置表属性,如行存、列存,指定分区等,只需轻轻一点就能完成建表操作。同时还能对新建的表查看最终的DDL语句以及数据预览。
image

  • 外部表
    交互式分析在底层与MaxCompute无缝打通,直接加速读取MaxCompute的数据。通常的做法是需要在交互式分析中新建一张外部表来查询MaxCompute表数据,需要保证两张表的字段、数据类型一一对应,若使用SQL会大大增加开发时间。

外部表模块支持一键创建外部表,只需一键搜索出MaxCompute表名(可跨工作空间读取MaxCompute中的表),就能创建出与之字段一一对应的外部表。同步字段可根据查询要求进行选择。创建外部表成功后,只需点击数据预览,就能实时查看MaxCompute中的数据,秒级交互式响应。
image

3.数据开发

数据开发模块主要与DataWorks调度模块打通,能实现经过交互式分析加速查询处理的数据周期性调度。
如何使用HoloStudio实现周期性调度请参见示例

4.终端

当业务变得越来越复杂时,数据量也会越来越多,相应的查询不仅在量上会增加,也会进行更多表的join也会变得复杂,为快速提升查询要求,HoloStudio特提供终端模块。终端可理解为封装后的psql客户端,只要您会使用sql语言,就能使用终端进行开发,实现数据的秒级交互式响应。
image

今天的HoloStudio初体验就介绍到这里了,学习完以上所有操作步骤,相信大家已经对HoloStudio有了初步的了解,也了解到了HoloStudio的灵活巧妙之处,现在开始使用HoloStudio,相信你的头发掉的频率也会减少哦。可关于HoloStudio难以琢磨怎么理解呢?那就不得不说,HoloStudio还支持更多神秘的功能,请大家搓搓小手期待下期内容吧!

在使用过程若大家有任何问题,欢迎随时进群开撩哦!
image

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
6月前
|
SQL 人工智能 数据挖掘
阿里云DMS,身边的智能化数据分析助手
生成式AI颠覆了人机交互的传统范式,赋予每个人利用AI进行低门槛数据分析的能力。Data Fabric与生成式AI的强强联合,不仅能够实现敏捷数据交付,还有效降低了数据分析门槛,让人人都能数据分析成为可能!阿里云DMS作为阿里云统一的用数平台,在2021年初就开始探索使用Data Fabric理念构建逻辑数仓来加速企业数据价值的交付,2023年推出基于大模型构建的Data Copilot,降低用数门槛,近期我们将Notebook(分析窗口)、逻辑数仓(Data Fabric)、Data Copilot(生成式AI)进行有机组合,端到端的解决用数难题,给用户带来全新的分析体验。
111295 119
阿里云DMS,身边的智能化数据分析助手
|
存储 SQL 消息中间件
基于袋鼠云实时开发平台开发 FlinkSQL 任务的实践探索
袋鼠云实时开发平台StreamWorks,⼀直致⼒于降低 FlinkSQL 的开发门槛,让更多的数据开发掌握实时开发能⼒,普及实时计算的应⽤。本文为大家介绍在袋鼠云实时开发平台开发 FlinkSQL 任务的四种⽅式。
166 0
基于袋鼠云实时开发平台开发 FlinkSQL 任务的实践探索
|
编解码 数据可视化 定位技术
神器-可视化分析之Basemap入门详(一)
今天咱们讲解一个画地图神器-BaseMap,看看这个神器讲给我们带来怎样的使用体验。
419 0
神器-可视化分析之Basemap入门详(一)
|
机器学习/深度学习 消息中间件 存储
【干货篇】bilibili:基于 Flink 的机器学习工作流平台在 b 站的应用
介绍 b 站的机器学习工作流平台 ultron 在 b 站多个机器学习场景上的应用。
【干货篇】bilibili:基于 Flink 的机器学习工作流平台在 b 站的应用
|
3月前
|
数据可视化
可视化神器,必须分享给宝子们,太香了
可视化神器,必须分享给宝子们,太香了
|
3月前
|
数据采集 SQL DataWorks
【颠覆想象的数据巨匠】DataWorks——远超Excel的全能数据集成与管理平台:一场电商数据蜕变之旅的大揭秘!
【8月更文挑战第7天】随着大数据技术的发展,企业对数据处理的需求日益增长。DataWorks作为阿里云提供的数据集成与管理平台,为企业提供从数据采集、清洗、加工到应用的一站式解决方案。不同于桌面级工具如Excel,DataWorks具备强大的数据处理能力和丰富的功能集,支持大规模数据处理任务。本文通过电商平台案例,展示了如何使用DataWorks构建数据处理流程,包括多源数据接入、SQL任务实现数据采集、数据清洗加工以提高质量,以及利用分析工具挖掘数据价值的过程。这不仅凸显了DataWorks在大数据处理中的核心功能与优势,还展示了其相较于传统工具的高扩展性和灵活性。
128 0
|
4月前
|
DataWorks 监控 数据挖掘
DataWorks产品使用合集之数据分析维表有什么用处
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
6月前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之要查看MaxCompute Studio中的项目中的计算任务代码,我该怎么操作
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
SQL 数据采集 数据可视化
用户数据分析与最佳实践以手游为例|青训营笔记
在企业竞争越来越激烈,获客成本越来越高的背景下,如何高效地优化产品和精细化投放运营是当前企业竞争的关键,而用户数据分析正是我们保持此竞争力的重要手段。
249 0
用户数据分析与最佳实践以手游为例|青训营笔记
|
存储 数据采集 数据可视化
千字干货带你入门数据仓库,跑通数据建模全流程(附视频)
个推资深大数据研发工程师为大家深入浅出地介绍了数据仓库的前世今生以及数据建模的常用方法。
563 0
千字干货带你入门数据仓库,跑通数据建模全流程(附视频)