开发者社区> 问答> 正文

介绍一下Apache Atlas工具?

介绍一下Apache Atlas工具?

展开
收起
张柠檬 2022-05-12 11:42:37 585 0
来自:阿里技术
1 条回答
写回答
取消 提交回答
  • Apache Atlas是数据治理体系中比较重要的一个产品,它主要负责元数据的管理,这个元数据就是指用来描述数据的数据,比如数据的类型、名称、属性、作用、生命周期、有效范围、血缘关系等等,在大数据系统中,元数据有着非常大的价值,一个比较成熟的数据系统中一般都会存在着这么一个元数据管理平台,元数据除了能让业务人员更加方便快捷理解我们的数据和业务,也有着帮助我们提升数据质量,消除信息不对称,以及快速定位数据问题等作用,所以如何有效的利用好这些元数据,使这些数据产生更大的价值,也是很多人一直在思考的事情。现在Atlas支持的数据源有Hive、Sqoop、Storm,其导入方式有HOOK和Batch两种方式,首次使用是Batch的同步方式,之后Atlas会利用HOOK主动获取到数据源的变化,并更新自身数据。

    2022-05-12 12:26:23
    赞同 展开评论 打赏
问答分类:
问答标签:
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
Apache Flink技术进阶 立即下载
Apache Spark: Cloud and On-Prem 立即下载
Hybrid Cloud and Apache Spark 立即下载

相关镜像