文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

如何在datawork上弄python3的pandas 库？

如何在datawork上弄python3的pandas 库？

展开

收起

真的很搞笑 2024-03-04 08:42:06 290 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在DataWorks上使用Python 3的Pandas库，您需要通过PyODPS节点来实现。以下是具体的步骤：
1. 创建PyODPS 3节点：您需要在DataWorks的数据开发页面创建一个PyODPS 3节点，因为PyODPS 3节点底层支持Python 3语言版本。
2. 编写MaxCompute作业：在创建好的PyODPS 3节点中，您可以直接使用Python代码编写MaxCompute作业。PyODPS提供了DataFrame接口来处理MaxCompute对象，并且可以转换成Pandas进行数据操作。
3. 配置调度参数：在开发PyODPS任务代码时，您可以设置运行参数hints，以及获取调度参数来配置您的任务。
4. 使用独享调度资源组：如果您的任务需要访问特殊的网络环境，建议使用独享调度资源组，并确保网络连通性以满足特定的网络需求。
5. 安装pyodps：您可能需要安装pyodps包，以便使用PyODPS的相关功能。可以通过pip install pyodps来进行安装。
6. 注意版本兼容性：目前DataWorks中使用的PyODPS版本是2.7，可能会存在一些兼容性问题，如乱序或乱码等。在使用Pandas时需要注意这些问题，并根据实际情况进行调整。
2024-03-04 14:45:14

赞同 1 展开评论
芯在这

方法一：如果您的是source文件，没有压缩，您可以参考下面文档：https://help.aliyun.com/document_detail/94159.html
方法二：在odps使用自定义函数及Python第三方库 https://help.aliyun.com/document_detail/90716.html ，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2024-03-04 10:08:20

赞同展开评论

问答分类：

Python 大数据开发治理平台 DataWorks

问答标签：

Python库 Python Pandas Pandas库 Python pandas库 python3 Pandas

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

使用MaxCompute Python SDK（PyODPS）时to_pandas 就不是集群模式?

306

1

0

使用datawork运行pyspark脚本，其中的python第三方库需要怎么导入？

618

13

0

大数据计算MaxCompute如何在datawork上弄python3的pandas 库？

328

4

0

怎么在datawork上安装Python第三方来源包？

478

3

0

DataWork中如何安装Python包？

424

1

0

在datawork写的python发送邮件，Foxmail可以收到邮件但是收不到附件，我把pytho

427

1

0

datawork里面写python脚本，最后输出excel到本地，写的本地文件路径，但是最后没写成功

321

1

0

那位大侠知道python3.6 下安装pandas依赖包的问题？

491

1

0

我想咨询函数计算搭建相关的问题。采用的是PYTHON3.7 的 flask框架。我逐步把依赖库添加

913

1

0

python中如何通过Pandas将每行的数据保存成csv文件？

727

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

阿里云Redis云数据库Python SDK实战——缓存操作与高可用优化

阿里云日志服务SLS Python SDK实战——日志采集、查询与分析

全局变量不“全局”？Python多进程这口黑锅背得冤

阿里云Qwen3.7-Max接入百炼大模型服务流程：API 调用、Token Plan订阅两种接入方式流程参考

RPA OCR 文字识别实战：本地离线识别、发票 / 合同多模态信息提取

热门讨论

热门文章

在DataWorks上使用PyODPS使用限制是什么？

调用数据源服务失败：调用数据源服务失败：获取实例的详细信息失败,请检查RDS购买者id和RDS实例名

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

DataWorks概述API网关是什么？

数据来源：com.alibaba.fastjson.JSONException: syntax er

你好，Dataworks为什么di传输的时候，有个字段传过来之后为空，源端数据不是空，怎么排查原因？

数据服务报429请求次数过多咋办呀

DateWorks上运行的任务，被kill掉了，日志中能查出来，被谁杀掉了吗？

在智能数据建模中涉及的FML是什么的缩写，什么意思？

DataWorks中ODPS SQL 执行计划是什么？

展开全部

云上一指禅：大数据产品DataWorks每日问答

欢迎加入飞天大数据平台交流群

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型，数据开发与分析效率再升级！

DataWorks产品使用合集之如何访问周期任务运维

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

【全新系列】DataWorks百问百答

DataWorks售前咨询

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

展开全部

还有其他疑问?