数据中台建设引擎Dataphin亲测体验报告二:功能易用性&界面设计

简介: 上次说完了Dataphin产品的功能完备性,今天咱们就来聊下功能体验细节的易用性和界面设计。功能易用性 评分:4.5分点评:原创设计,越用越好用概要:主打的建模研发功能,使用体验独特,如果说前面提到的常规大数据开发功能是编码编辑器,那么建模研发功能就是智能计算器——5个工作日时间,2个ETL人员,完成Boss定的一个业务线的数据验证(原来是3个ETL同学长期维护,业务报表需求已经供不应求),ETL快速熟悉怎么使用之外,几位主要业务需求方也开始跃跃欲试。

上次说完了Dataphin产品的功能完备性,今天咱们就来聊下功能体验细节的易用性和界面设计。

功能易用性 评分:4.5分
点评:原创设计,越用越好用

概要:
主打的建模研发功能,使用体验独特,如果说前面提到的常规大数据开发功能是编码编辑器,那么建模研发功能就是智能计算器——5个工作日时间,2个ETL人员,完成Boss定的一个业务线的数据验证(原来是3个ETL同学长期维护,业务报表需求已经供不应求),ETL快速熟悉怎么使用之外,几位主要业务需求方也开始跃跃欲试。

主要功能操作步骤如下,供参考:
Step1:基础数据中心上云
这个业务线ODS层表大概80张,团队2个开发小哥大概用了2天半配置数据源、同步任务、Python任务,完成上云第一步~
这一步还是比较简单的,都是简单的界面操作。

Step2:公共数据中心上云
ODS层数据上云后半程,自己参与,和另外一位分析师同学大概花了1天时间,仿照示例,走通了一个小场景,熟悉了产品操作。并在工作日结束之前,顺利完成所有任务!
小场景大致如下:
规划:构建业务板块和数据域
这里都是一些表单操作,按照界面操作就行。
image

规范定义:维度、业务过程
这里也都是一些表单操作,按照界面指引就行,必填项填写正确就行。
image

维度要求配置主键计算逻辑——只要会写SQL中 “select from” 就行。
image

逻辑表:维度逻辑表/事实逻辑表
这里也是一些表单操作,操作步骤有点多,但是基本上可以按照界面引导操作,也不会出错。
大致如下:
image

整体体验还是挺好的:
比如添加事实模型的度量,这里选择表之后,直接勾选字段,右侧会自动读取元数据,生成添加的字段和计算逻辑。
image

比如比如可以可视化看到雪花模型结构,也能修改关联维度。修改提交成功后会提示下。
image
image

比较神奇的是,这样提交后,后台调度任务和代码就生成好了?!
image

开发环境的操作完毕,还要发布到生产环境。支持批量发布,这个操作比较简单。
image

发布校验提示,还是比较细心的,也可以防止发布到生产环境出错。
image

不过部分提示还是很奇怪的,这个,就看不懂了……
image

然后一键切换生产环境查看,非常平滑。一切都很顺利完成惹~~~
image

规范定义和逻辑表:派生指标和汇总逻辑表
定义派生指标确实就像产品文档介绍的,选择几个选项,就可以批量创建很多指标!大大提高数据生产效率。

不过,操作前,需要根据OneData的方法论,先分析和定义原子指标、业务限定,还需要将原子指标用到的来源逻辑表(问了技术支持,就是原子指标定义时,选择的来源逻辑表)上定义关联维度作为统计粒度,才能实现:
派生指标=原子指标+统计粒度+业务限定+统计周期
这样的效果。

操作步骤基本阿里云的网站都有,这里就大概分享下几个典型页面和操作注意事项,经验传承下。
原子指标,类似select的代码片段。定义原子指标尤其注意下,数据类型会用到派生指标里!谨慎定义!
image

业务限定,界面和原子指标差不多,更类似where条件的代码片段,不需要定义数据类型和统计周期标识。
派生指标,选择所需选项,组合定义即可。已生成组合的派生指标,不会重复生成~~
image

汇总逻辑表,与派生指标的统计粒度一一对应,派生指标根据统计粒度自动汇聚到汇总逻辑表上。
image

汇总逻辑表支持自定义指标,定义关联主键和时间分区,即可将自定义的指标挂载到汇总表使用。
image

值得一提的是,派生指标提交后,汇总逻辑表也会自动生成调度节点和代码。

即席查询汇总逻辑表,可获取主键所属关联维度的维度逻辑表的属性,也就是说,汇总逻辑表也类似雪花模型一样,每个地方都可以通过逻辑表的关联维度结构,遍历查询数据。这样防止维度逻辑表的数据,无意义冗余~好评设计!
image

关于“潜水”功能的二三事
分享了这么多操作步骤,大家可能和我有一样的感受,功能有点太多,产品引导还不够友好,所以会出现这样的问题:
1)不知道功能怎么用。比如公用计算逻辑,虽然界面有提示,但是缺少直接引导,还是因为其他产品问题咨询,才从技术支持那里得知这样一个神奇功能可以用。
2)功能的选择配置多,会有选择困难症。比如事实逻辑表,区分周期快照表和事务型表之外,这里还需要选择有主键、无主键?选择后,字段添加和校验方式也不太一样,如果没有特定场景,功能使用会有点懵。
3)有些功能太隐藏!比如支持雪花模型这样 “事实表.维度表.…….维度属性”这样查询字段数据,这个很方便啊,但是没有提示使用,偶尔情况发现使用。

其他期待
虽然功能有特色,总结下来,还是有些使用问题,大概如下:
1)概念太多,上面还没提到层级维度、衍生原子指标,还有各种套路,需要慢慢琢磨。这些概念一开始暴露出来,对我们这些从0开始用的小客户,有些不太友好,熟悉的过程虽然不长,但是一开始的使用体验会有折扣;
2)初始化操作事项较繁琐,为了最后1分钟创建派生指标,业务CDM层还有较漫长的路要走,这里伴随着各种概念和定义的纠结,对于普通的无数仓经验的ETL人员,还是有些挑战的;
3)一些细节功能还不支持:比如多事务的双主键事实表,逻辑表也不支持小时调度(技术问题?),小时逻辑表也不支持;
4)运维配套功能缺少:逻辑表不好运维,缺乏全局的依赖关系及批量管理机制,全量调整来不及。

总的来说,这4.5分给得有点低,分低的主要原因——对于没有采购专家服务的我们小公司来说,入门还是有点难度,踩了一些坑,有些输在起跑线的感觉,应验了一句“万事开头难”。
不过真的是越用越好。作为开发者,感觉Dataphin和传统的ETL软件大不相同,有设计感之外,从写代码角度,真的提升效率~后续找数据、查数据、数据体系运维都方便,毕竟命名和对象关系都清晰了~

产品界面设计 评分:4.8分
点评:科技感与设计感
概要:
之前听UED提到站酷上有人分享ToB产品设计,思路独特,设计有创意,参详对比下实际产品,产品设计还原上还是达到设计师目标——

  • 明亮多样的色彩搭配
  • 3D的icon设计
  • 契合主题的动画
  • 点睛的界面切换转场
  • 活力界面

这些都让原本枯燥的开发工具多了一些生气与活力,用这样的工具进行数据研发,心情也好些。
image

交互较友好
值得一提的是,产品的操作交互体验也不错,主要流程的必要引导、校验和提示都恰到好处。
image

总结:独树一帜,值得尝试
整体来说,好的点:

  • 作为To B产品,比较成熟了,项目角色管理、编辑器、生产开发隔离、多云多计算引擎这些功能也都可以支持,整体链路很顺畅。
  • Dataphin自动化研发是真的牛,这么多One系列复杂概念,最终能实现开发、发布、运维、资产一套,也是厉害的,至少说明OneData概念成功落地成体系化的产品了!
  • 研发经验和知识沉淀产品中,各种数据体系可以快速迭代,再也不用查各种文档,维护数据也方便了。
  • 业务视角管理,数据易查易回溯,比如出现问题,可以根据界面快速回溯源头、追溯问题链路(派生指标→原子指标/业务限定/统计粒度→事实/维度逻辑表),数据污染之类问题,很好查以及修复。

目前不好用的点,主要在初始化使用难,但是使用上手一段时间,也就习惯了。
(这里想提个需求,这些智能化过程也太黑盒了,有时候数据不太好验证,是否有什么方法可以对比界面配置代码和任务链路 vs 智能化生成代码和任务链路?另外有时候有代码优化,也不知道优化路径是什么情况,希望可以让咱们开发同学也参与下,有个智能引擎的运维界面,就好了,歪歪一下~~)

听说最近有新版本要上线,很期待,希望能和上面问题一起升级解决,给咱们开发者带来更多不一样惊喜,这样才能让咱们这些生产力给企业管理者带来更多价值啊!

结语:
阿里巴巴数据中台团队,致力于输出阿里云数据智能的最佳实践,助力每个企业建设自己的数据中台,进而共同实现新时代下的智能商业!
阿里巴巴数据中台解决方案,核心产品:
Dataphin,以阿里巴巴大数据核心方法论OneData为内核驱动,提供一站式数据构建与管理能力;
Quick BI,集阿里巴巴数据分析经验沉淀,提供一站式数据分析与展现能力;
Quick Audience,集阿里巴巴消费者洞察及营销经验,提供一站式人群圈选、洞察及营销投放能力,连接阿里巴巴商业,实现用户增长。
欢迎志同道合者一起成长!

相关实践学习
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
相关文章
|
2月前
|
数据采集 SQL 数据可视化
Dataphin功能Tips系列(72)一键数据探查,打造高质量数据开发、分析流程
Dataphin数据探查功能助力高效识别数据质量问题,支持手动与自动两种探查模式。通过一键生成质量报告,快速检测空值、异常值、重复值等问题,全面掌握数据分布与健康状况,提升数据准备与分析准确性。
229 7
|
2月前
|
机器人 数据中心
Dataphin功能Tips系列(79)精准获知标准更新动态,协同治理更高效
Dataphin支持数据标准变更订阅,可实时通过站内信、邮箱或钉群机器人通知相关人员,确保业务及时响应。用户可通过标准列表、个人中心等入口批量订阅,变更消息包含状态、版本及跳转链接,便于快速查看与处理。
142 8
|
2月前
|
数据采集 监控 调度
Dataphin功能Tips系列(76)质量规则调度配置系列(3)-定时调度
Dataphin「定时调度」功能支持按需设定数据质量检测时间与频率,适用于定期检查数据质量问题的场景。提供手动配置和系统推荐两种方式,可自动执行规则并生成报告,帮助用户高效发现并处理问题。
108 9
|
2月前
|
数据采集 运维 调度
Dataphin功能Tips系列(75)质量规则调度配置系列(2)-固定任务触发调度
Dataphin“固定任务触发调度”支持在任务成功或运行前触发质量规则校验。适用于表数据来源任务固定的场景,通过绑定强规则可阻断下游任务,防止脏数据扩散,提升数据质量管控能力。
127 9
|
2月前
|
数据管理
Dataphin功能Tips系列(78)自定义属性助力资产精细化管理
Dataphin V5.3升级自定义属性功能,支持多选、超链接及引用系统属性,实现资产“归口部门”与组织架构同步、指标看板一键跳转等场景,提升资产配置灵活性与管理效率。
129 8
|
2月前
|
数据采集 调度
Dataphin功能Tips系列(74)质量规则调度配置系列(1)-数据更新触发调度
Dataphin通过“数据更新触发调度”功能,结合强规则校验,可在订单表数据更新时自动触发质量检查,异常时阻断下游任务,有效防止脏数据扩散,保障关键业务链路的数据准确性与稳定性。
153 8
|
2月前
|
安全 数据安全/隐私保护
Dataphin功能Tips系列(73)Dataphin行级权限:构建灵活高效的权限管理体系
Dataphin行级权限通过“控制字段”实现精细化数据管控,有效避免传统字段权限过度开放带来的安全风险,提升权限管理效率与灵活性,满足复杂场景下的数据安全需求。
188 4
|
2月前
Dataphin功能Tips系列(77)如何实现数据资产上下架的精准管控与高效流转
在企业数据治理中,Dataphin支持按资产范围灵活配置上下架审批流程。通过标签、项目等条件圈选资产,绑定自定义审批模板,实现核心资产精细管控与大规模资产高效流转的平衡,提升数据运营效率。
119 1
|
3月前
|
数据采集 调度
Dataphin功能Tips系列(74)质量规则调度配置系列(1)-数据更新触发调度
在数据生产中,数据质量直接影响业务准确性。Dataphin 提供“数据更新触发调度”功能,结合强规则校验,可在数据更新时自动检测质量,异常时阻断下游任务,防止脏数据扩散,保障数据准确性与流程稳定。

热门文章

最新文章