大数据计算MaxCompute pyodps DataFrame可以分批获取数据吗?比如每批读10000行
可以的。
MaxCompute pyodps DataFrame 可以从数据源中分批获取数据,只需要设置 read_options 中的 num_rows 属性。num_rows 指定在每次获取数据时从数据源中读取的数据量。如果 num_rows 为 None,将从数据源中读取所有数据。
以下是一个从数据源中分批获取数据的示例代码:
data_frame = odps.DataFrame('my_table')
num_rows = 100
data_frame = data_frame.read(read_options={'num_rows': num_rows})
这个代码会从数据源中每隔 100 行读取一次数据,直到读取到所有数据。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。