用 file_fdw 映射csv文件,然后 upsert 性能会比copy差多少啊?
fdw+upsert应该更快 但是只能更新一次, 一条记录不能在一个query中被多次upsert. 如果csv文件中可能出现PK唯一的单条记录多次更新, 建议你导入时用窗口查询处理一下.
此答案来自钉钉群“PG|POLARDB技术进阶"
使用 file_fdw
映射 CSV 文件后,使用 COPY
和 UPSERT
的性能差异会因多种因素而异。以下是一些可能导致性能差异的因素:
通常情况下,COPY
把数据一次性加载到 Postgres 中,因此,它比 UPSERT
更快。但是,如果你希望更新表中的现有数据,则必须使用 UPSERT
命令。因此,你需要权衡加载新数据的速度和更新现有数据的效率,对于不同的数据集和用例,这个选择可能会有所不同。你可以对两种方法分别运行性能测试,并根据测试结果决定哪种方法更适合你的场景。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
PolarDB 分布式版 (PolarDB for Xscale,简称“PolarDB-X”) 采用 Shared-nothing 与存储计算分离架构,支持水平扩展、分布式事务、混合负载等能力,100%兼容MySQL。 2021年开源,开源历程及更多信息访问:OpenPolarDB.com/about