【藏经阁一起读(9)】读《阿里云 JindoFS+OSS 数据上云实战》,你有哪些心得?
拜读了读《阿里云 JindoFS+OSS 数据上云实战》这本书,让我学习到了如何进行数据迁移,包括迁移HDFS海量文件迁移到OSS、 如何将Hive数据按分区归档到OSS等。如何使用JindoFS缓存加速,用Fluid+JindoFS对OSS、HDFS上的数据以及海量小文件的训练加速, 以及JindoTable计算加速。这本书非常的有实践参考意义,JindoFS是基于阿里云对象存储OSS,为开源大数据生态构建的Hadoop兼容文件系统 。JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS的访问; 提供块存储模式(Block),以充分利用OSS的海量存储能力和优化文件系统元数据的操作。这一些特性非常的针对典型的数据湖场景, 推荐使用SDK或者Cache模式以支持大数据分析和AI训练加速。这里面的很多实践我们之间就可以拿来使用,是非常好的方法论。 感谢专家们提供的《阿里云 JindoFS+OSS 数据上云实战》这本书。
赞6
踩0