开发者社区> 问答> 正文

RDS什么场景用presto呢?如果presto很高效,hive,spark对比优劣

RDS什么场景用presto呢,如果presto很高效,hive,spark对比优劣,以及使用场景是什么呢?

展开
收起
鸡蛋灌饼儿 2023-01-15 18:29:06 564 0
1 条回答
写回答
取消 提交回答
  • "个的使用场景还是在交互式即席查询这一部分,可以让我们的分析变的非常丝滑 主要区别的话 第一个就是,Presto使用ANSI SQL,而Hive使用HiveQL,刚才我们简单的语句其实并没有影响,但整体上有些差异的,比如我们hive的侧窗口函数 LATERAL VIEW 第二个比较重要的就是,数据量相对大或者存在我们意料之外的数据膨胀这种场景的话,更推荐hive和spark来做每日跑批的计算。这个可以结合我们昨天的一个答疑来看,就是什么时候会落盘,spark和hive在数据量大,oom的时候会进行落盘保证任务的完成。但是presto直接抛oom异常了 impala这一块其实和presto一样都是属于olap的引擎,impala的计算速度也是出了名的快,多表查询性能和presto可以说不相上下,但是内存占用确实不小,单表查询有些逊色,使用上来说有个缺点,就是不支持date类型,需要存成string,presto支持的update等操作也不支持,综合性能上来说presto更优一些——该回答整理自钉群“企业运维训练营之大数据EMR原理与实践”

    2023-01-15 19:46:01
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
作为全球云计算的领先者,阿里云为全球230万企业提供着云计算服务,服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务,给用户带来极速愉悦的服务体验。
问答排行榜
最热
最新

相关电子书

更多
Hive Bucketing in Apache Spark 立即下载
spark替代HIVE实现ETL作业 立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践 立即下载