开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 视频 > 正文

利用持久内存提速Spark

发布者:Dev-Talk 2020-09-09 11:51:50 1256
视频介绍

主要探讨如何在Spark上使用持久内存这一新技术来进一步提速性能。具体会介绍基于Plasma的共享内存方案来提速SQL数据源访问的性能以及利用持久内存扩展Spark现有内存磁盘存储层级来提速RDD cache在迭代式计算中的效果。

讲师介绍:

纪琨尚,英特尔亚太研发有限公司大数据部门的软件工程师,专注于Spark计算框架上基于Optane PMEM的优化
叶宇强,英特尔亚太研发有限公司大数据部门的资深软件工程师,专注于Spark计算框架上基于Optane PMEM的优化


阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
邀请你加入钉钉群聊Apache Spark中国技术交流社区,点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,X7S/0/QcrLMkK7QZ5sw2oTvoYW49u0g5dvGu7PW+sm4=&_dt_no_comment=1&origin=11。</br> 微信公众号:Apache Spark技术交流社区 为 Spark 爱好者提供一个交流技术和传递资讯的平台,在这里你可以掌握大数据计算领域最前沿的资讯,可以与 Spark 技术大牛面对面交流,还有不定期社区福利领取哟~
+ 订阅

相关产品

  • 开源大数据平台 E-MapReduce
  • 相关文章
    更多