带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——7. 自助分析:灵活分析,快速释放数据价值

本文涉及的产品
智能数据建设与治理Dataphin,200数据处理单元
简介: 带你读《构建企业级好数据(Dataphin智能数据建设与治理白皮书)》——7. 自助分析:灵活分析,快速释放数据价值

7. 自助分析:灵活分析,快速释放数据价值

1) Dataphin分析平台概述

Dataphin分析平台是一个便捷高效的数据分析平台,提供自助取数、数据可视化、数据分析、分析结论产出与分享等产品功能,旨在为更多非专业数据开发人员,如数据分析、产品、运营等工作人员提供便捷高效的数据分析能力,提升日常取数分析效率与体验。

 

分析平台支持基于个人视角创建SQL查询任务与Notebook,支持新建生产环境手工表。

 

SQL查询任务:SQL查询任务提供沉浸式数据分析环境,可对有查询权限的数据进行快速的查询与可视化分析。


Notebook任务:Notebook是集文本与SQL查询于一体的交互式数据分析笔记本。在SQL查询任务的功能基础上,支持了Markdown单元与每次查询结果自动生成临时表功能。加强了数据分析场景下的便捷性与完整性。


手工表:支持在页面上手工编辑数据的表。简化生产表的创建与更新流程,无需编写SQL代码,在手工表的编辑页面进行可视化编辑,即可修改引项目生产表的数据,实现最新数据的快速流通。


2) Dataphin分析平台功能特色

面向个人视角:分析平台是一个面向个人视角的平台,用户可以直接进入分析平台创建自己的任务或者创建手工表(需要有建表权限)。“我”创建的任务仅有“我”和“我”主动分享给的用户可见。从个人视角出发,便于更高效、专注地管理个人的任务与数据分析结果。

灵活选择计算引擎:分析平台中支持选择“我”拥有即席查询权限且绑定了离线计算引擎的Dev/Basic项目运行SQL代码。另外,超级管理员或系统管理员也可以在系统设置中为分析平台绑定一个专用的计算引擎,为无法加入开发项目的成员提供计算资源。该特点支持先写代码,不受环境限制,随时记录代码灵感。

分享与协作:支持分享Notebook与SQL查询任务,实时分享查询结果及分析结论。被分享者仅可查看,不可编辑,保证自己创建的任务不会被随意修改。也可取消分享,收回被分享者的查看权限。支持分享手工表,根据被分享者对该表的权限,可对手工表进行查看或编辑操作。

3) Dataphin分析平台使用场景

a) 取数分析自闭环,打通数据消费链路

当数据分析师无法加入开发项目,查询取数会遇到很多限制,等待数据团队排期耗时往往很久,拿到结果也要导出到其他平台才产出分析报告,数据消费链路割裂不顺畅。

为分析平台绑定专用计算源,分析师可直接在分析平台中使用Notebook,对有权限的数据进行自助取数与洞察分析,提取出有效结论,直接在Dataphin形成一篇包含背景、数据、结论的完整数据分析文档。可分享同步自己的数据查询结果和分析结论给相关方,也可随时收回权限。

 

b) 分析报告图文结合,结论重点清晰呈现

数据分析报告堆叠了太多数据和文字,对查询出来的数据没有直观的感受,理解门槛高。

 

使用分析平台SQL查询任务或Notebook任务中的可视化功能,提供可视化能力,包括折线图、条形图、柱状图和饼图。无需把数据同步到其他平台,在Dataphin分析平台即可实现一站式可视化分析。

c) 手工维护数据表,生产环境快速更新

有一些手动维护的业务数据,如客户维表,每次更新数据需要运营对接数据开发走发布流程,耗时较久,导致最新数据不能及时共享出去。

 

针对运营等非数据开发的工作人员,可以在分析平台快速创建生产环境的手工表,无需编写SQL代码,即在编辑页面手动更新表数据,让更新不规律的维表数据,在生产链路中快速更新到最新版本。并且支持分享给相关同事,共同维护手工表数据。

d) 调试复杂代码,提升数据开发效率

数据开发的时候,业务逻辑复杂,SQL代码层层嵌套,一个任务中成千上万行的代码,自己难以调试,他人难以理解。

 

使用分析平台Notebook任务,将代码变为段落化结构,高效拆解复杂代码,降低代码复杂度,便于理解和调试。数据查询结果自动生成临时表,可高效复用。查询结果也会保存在任务中,再次打开无需再次运行,节省计算等待时间与资源。

e) 私有数据探索,空间自主可用

项目中的即席查询任务保存在项目公共空间中,公开可见。当项目成员建的任务很多时,也无法迅速定位自己任务。

 

使用分析平台的SQL查询任务,从个人视角出发,可更高效、专注地在私有空间中管理和保存自己的查询代码与查询结果。支持分享,仅被分享者可查看任务。

相关文章
|
6月前
|
SQL DataWorks 监控
Dataphin常见问题之数据怎么都补不过去如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
6月前
|
存储 Oracle 关系型数据库
Dataphin常见问题之想要周期执行任务如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
6月前
|
SQL 分布式计算 DataWorks
Dataphin常见问题之补数据任务卡着不动如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
6月前
|
Java 数据处理 调度
Dataphin常见问题之离线管道同步数据datax就报连接超时如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
4月前
|
安全 Java Apache
Java中的数据安全与隐私保护技术
Java中的数据安全与隐私保护技术
|
23天前
|
数据处理 调度
Dataphin功能Tips系列(26)-事实逻辑表配置数据延迟
零售行业中,订单数据是每天晚上由pos系统同步至数据中台,但门店人员经常会没有及时将订单信息录入pos,也许隔天或是隔几天才录入,这会导致指标的不准确性,数据中台的开发人员往往需要进行批量补历史分区的数据,这时怎么才能减轻开发人员的工作,让系统能够自动补前几天分区中的事实逻辑表中的数据呢?
|
4月前
|
SQL 关系型数据库 MySQL
如何在Dataphin中构建Flink+Paimon流式湖仓方案
当前大数据处理工业界非常重要的一个大趋势是一体化,尤其是湖仓一体架构。与过去分散的数据仓库和数据湖不同,湖仓一体架构通过将数据存储和处理融为一体,不仅提升了数据访问速度和处理效率,还简化了数据管理流程,降低了资源成本。企业可以更轻松地实现数据治理和分析,从而快速决策。paimon是国内开源的,也是最年轻的成员。 本文主要演示如何在 Dataphin 产品中构建 Flink+Paimon 的流式湖仓方案。
7718 10
如何在Dataphin中构建Flink+Paimon流式湖仓方案
|
4月前
|
SQL 运维 安全
【产品升级】Dataphin V4.2重大升级:上线敏捷版,打通数据资产管理和消费,开启数据价值放大新篇章
Dataphin 是阿里巴巴旗下的一个智能数据建设与治理平台,旨在帮助企业构建高效、可靠、安全的数据资产。在V4.2版本中,Dataphin敏捷版上线助力企业打造轻量版数据中台,打通数据资产管理和消费,陪伴企业迈入数据高价值应用新阶段。
1875 2
【产品升级】Dataphin V4.2重大升级:上线敏捷版,打通数据资产管理和消费,开启数据价值放大新篇章
|
3月前
|
JSON 数据管理 关系型数据库
【Dataphin V3.9】颠覆你的数据管理体验!API数据源接入与集成优化,如何让企业轻松驾驭海量异构数据,实现数据价值最大化?全面解析、实战案例、专业指导,带你解锁数据整合新技能!
【8月更文挑战第15天】随着大数据技术的发展,企业对数据处理的需求不断增长。Dataphin V3.9 版本提供更灵活的数据源接入和高效 API 集成能力,支持 MySQL、Oracle、Hive 等多种数据源,增强 RESTful 和 SOAP API 支持,简化外部数据服务集成。例如,可轻松从 RESTful API 获取销售数据并存储分析。此外,Dataphin V3.9 还提供数据同步工具和丰富的数据治理功能,确保数据质量和一致性,助力企业最大化数据价值。
152 1
|
4月前
|
运维 关系型数据库 调度
想一套Dataphin管理云上云下的集群和数据?“注册调度集群”来帮忙!
在实际业务场景中,部分企业在云上和云下(本地机房)都存在集群和数据库,企业期望通过一套Dataphin同时对这些集群和数据库进行管理,如何有效解决数据跨网络传输带来的安全性低和流量成本高的问题是其中的关键。为了解决上述问题,Dataphin推出“注册调度集群”功能,帮助企业实现一套Dataphin管理云上云下的集群和数据。