开发者社区> 问答> 正文

Dataphin和Dataworks的区别与各自定位?

已解决

从产品功能和应用场景看,Dataphin和Dataworks十分类似。
请问Dataphin和Dataworks的主要区别是什么? 以及阿里对这两个产品各自的定位是什么?

谢谢!

展开
收起
junjundu 2019-04-26 19:19:05 58706 2
6 条回答
写回答
取消 提交回答
  • 多年大数据底层技术经验,对开源hadoop、业界各家云厂商的大数据技术都有所了解。目前专注于大数据平台技术以及数据中台(数据仓库)建设,致力于如何将数据中台模型灵活应用于商业化服务。
    采纳回答

    作为两款产品的深度使用者,浅略地谈一谈dataworks和dataphin两款产品的区别。

    区别1:产品功能不同

    1、Dataworks,在阿里集团内部为大家所熟知的部分是D2,在阿里云则是数加平台的主体-数据工厂。DataWorks(数据工场)具备全栈数据研发能力(数据集成与开发、 生产运维调度、离线与实时分析、数据质量治理与资产管理、安全防护、数据共享与服务、机器学习、数据应用搭建)的大数据平台;
    2、Dataphin,通过输出阿里数据中台实战沉淀的大数据建设体系OneData+OneID +OneService(产品+技术+方法论),一站式提供集数据引入、规范定义、数据建模、数据研发、数据萃取的全链路智能数据构建及管理服务。 
    一句话总结:  DataWorks具备全栈数据研发能力和机器学习开发能力的大数据平台,这是dataworks的优势,劣势就是不具备数据中台(数据仓库)建设方法论的指导; Dataphin具备完善的“OneData+OneID +OneService(产品+技术+方法论)” 数据中台(数据仓库)建设方法论构建体系,这是dataphih的最大优势,劣势就是不具备很强的全栈数据研发能力,暂时也不具备机器学习开发能力。----

    区别2:产品定位不同

    1、Dataworks 定位为大数据开发平台,ETL、数据仓库建设等对开发者不做任何限制。开发者可以利用dataworks做任意想做的工作,数据中台(数据仓库)构建的方法论也不做任何限制。开发者可以利用dataworks,既可以按照维度建模理论构建数据中台(数据仓库)、也可以按照范氏建模理论构建数据中台(数据仓库)、也可以按照E/R理论构建数据中台(数据仓库),灵活性是dataworks的优势之一,当然也是劣势之一。因为缺乏数据中台(数据仓库)建设方法论的支持,dataworks对于缺乏数据中台建设方法论经验的开发者(或者企业)不够简单易用;
    2、Dataphin 定位于输出阿里巴巴数据中台方法论,开发者严格按照基于阿里多年零售经验的维度建模理论构建数据中台(数据仓库)。“设计即开发”,这是dataphin坚持的核心理念,使用dataphin的时候,开发者需要严格定义业务板块、数据域、业务过程、维度、原子指标、派生指标,然后“傻瓜式”地构建数据中台(数据仓库)。开发者可能都不用写任何代码(甚至连sql都可能不用写),只要按照上述维度建模方法论完成所有设计,即可构建数据中台(数据仓库)。----

    区别3:实时计算能力

    不论是dataworks还是dataphin,均定位于离线批量开发能力。对于实时计算能力的支持,dataworks比dataphin稍微更强一些。利用dataworks集成的datahub+flink等工具能力,能够实现一些简单应用场景的实时计算能力; dataphin也在规划实时计算能力,预计再过几个月,dataphin最新版本也能实现一些简单场景的实时计算能力。

    【总结】

    1、如果开发者(或者企业)希望傻瓜式的构建数据中台(数据仓库),而且是借鉴阿里基于零售业务积累的“OneData+OneID +OneService”方法论构建维度建模体系的数据中台,那么dataphin是不错的选择;
    2、如果开发者(或者企业)希望购买一套全栈数据研发能力的大数据平台,涵盖完善的数据集成与开发、生产运维调度、离线与实时分析、数据质量治理与资产管理、安全防护、数据共享与服务、机器学习、数据微服务应用搭建等能力。而且数据中台(数据仓库)不限制于维度建体系,那么dataworks是不错的选择。

    2020-01-06 11:32:13
    赞同 14 展开评论 打赏
  • 楼上有、没有啥的是软文吧,高赞说的非常好。 1、从产品历史来说,集团内部大约从09、10年左右开始,一直是使用Dataworks来建设数据中台的,随便抓个BU的数据工程师问下就知道目前他们还是在使用Dataworks,包括现在的dataphin的团队,原本都是dataworks优秀的使用团队,建设了数据银行、生意参谋等明星产品。基于这么多年数据中台的建设经验,数据中台团队在2018年左右推出了dataphin产品。所以没有必要纠结到底哪个产品是做数据中台的,理论上来说都能做, 2、从产品使用层面来说,Dataphin严格按照维度建模的理论来贯彻三个one的数据中台建设经验,具备傻瓜式的产品使用与操作体验,但如果没有对于数仓、建模等知识具备一定的理解,建设起来或者使用这些产品的功能还是有一定难度。dataworks自由、灵活、稳定,但是因为发展了很多年,功能大而全,新用户进去估计都不知道从哪一步开始,很多功能模块都不一定会去点,模块之间的使用也比较割裂。 3、从功能层面,dataworks更加大而全,市面上做数据开发平台的基本都会看Dataworks的功能,但是Dataphin强在维度建模、数据资产等偏业务端的功能。我看Dataworks今年也上了基于ER建模的产品,估计也在补齐这块能力,未来两个产品的功能的重合度将会越来越高,但估计不会改变灵活与限定的两个产品定位。 4、从市场来看,dataphin作为后进者,采取的是高举高打的策略,同时由于对于业务有较好的理解,更容易打动客户,特别是新零售的企业。dataworks更强在平台功能,覆盖的客户范围也更加广,比如政府金融互联网等很多都是,但是作为平台,缺少对业务的理解,只能靠客户自己学习使用。 5、总结 如果你的企业技术人员不多,建议使用Dataworks就可以,技术人员相对都喜欢更灵活的产品,招几个不太资深的数仓工程师,拿着大数据之路那本书,也可以把数据中台搭起来 如果你的企业对于数仓、建模经验较为丰富,使用datahpin可以让你更快地完成数据中台的建设。

    2021-05-10 13:27:52
    赞同 6 展开评论 打赏
  • 一句话讲:dataworks是数据集成和处理引擎,侧重技术底层实现,主要干ETL,而Dataphin侧重于完整大数据仓库体系建设的生态化环境(未来进一步开放会进化为公共数据市场,大家可在这个平台或者说生态中,创建更细分的数据业务支撑)

    2020-08-14 15:09:34
    赞同 2 展开评论 打赏
  • dataphin有完整的数据模型设计,dataworks没有。

    dataphin有体系化的数据指标管理,dataworks没有。

    dataphin有数据萃取,核心实体的标签构建与管理,dataworks没有。

    dataphin有基于逻辑模型的语义的OneService能力,dataworks没有。

    dataphin有灵活自助的数据资产治理能力,dataworks没有。

    dataworks有SQL编辑器,dataphin有。

    dataworks有图形化的调度平台,dataphin有。

    dataworks有数据地图,dataphin有。

    dataworks有数据质量管理,dataphin有。

    2019-11-28 16:29:58
    赞同 4 展开评论 打赏
  • dataphin,是基于阿里巴巴自己数据中台沉淀的方法论OneData(OneModel、OneID、OneService),产品化后的智能数据构建和管理平台,除了代码编辑,还有数据架构、数据规范定义、自动建模、代码自动生成、数据资产管理等功能,更偏业务视角出发进行数据标准化建设和体系化组织,关键词:智能自动、标准规范、阿里巴巴方法论。 dataworks,是一个大数据开发的IDE,可以写代码、执行代码、进行调度。

    2019-07-17 23:34:24
    赞同 6 展开评论 打赏
  • Dataworks,是一个基于任务形式的数据调度平台,是一个工具,用于处理数据ETL的;
    Dataphin,是提供数据服务的,规范数据仓库建设,定义dwd层数据,定义原子,派生指标,形成主题式dws层数据,对外服务;
    简单来说,一个是数据计算层的ETL产品,一个是数据服务层的产品

    2019-07-17 23:34:24
    赞同 7 展开评论 打赏
滑动查看更多
问答排行榜
最热
最新

相关电子书

更多
DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
DataWorks商业化资源组省钱秘籍-2020飞天大数据平台实战应用第一季 立即下载