MaxCompute提供了Python SDK方法说明,您可以使用Python的SDK来操作MaxCompute。说明PyODPS 2节点底层的Python版本为2.7。推荐通过SQL或者Dataframe的方式处理数据,详情请参见DataFrame概述。不建议您直接调用pandas等第三方包来处理数据。PyODPS 2节点获取到本地处理的数据不能超过50 MB,节点运行时占用的内存不能超过1 GB,否则节点任务会结束运行。请避免在PyODPS 2节点中写入过多的数据处理代码。Hints参数的详情请参见SET操作。PyODPS 2节点主要针对MaxCompute的Python SDK应用。对于纯Python代码的执行,您可以使用Shell节点执行上传至DataWorks的Python脚本。如果您需要在PyODPS 2节点中调用第三方包,请参见在PyODPS节点中调用第三方包。PyODPS操作实践请参见使用MaxCompute分析IP来源最佳实践和PyODPS节点实现结巴中文分词,更多信息请参见PyODPS文档。 https://help.aliyun.com/document_detail/137514.html——此回答整理自钉群“DataWorks交流群(答疑@机器人)”
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。