开发者社区> 问答> 正文

ODPS中如何添加Python库为资源?

目前正在使用公测的Python UDF功能, 写了几个NLP方面的UDTF, 用到了jieba分词库.
将UDTF注册后, 在odpscmd客户端中运行, 返回结果:

FAILED: ODPS-0140051:Invalid function - class 'PyWordSegment.PyWordSegment' Traceback (most recent call last):
File "", line 46, in get_signature

clz = utils.import_from_string(object_path)

File "", line 130, in import_from_string

mod = __import__(modname, globals(), locals(), [], -1)

File "", line 6, in

import jieba.posseg as jieba_pos

ImportError: No module named jieba.posseg
for function 'pywordsegment'

这时该如何将整个jieba库作为资源导入ODPS中? 已经试过将其打成zip包上传并让UDTF引用, 但无论上传为file还是上传为archive都无效, 报错相同.

展开
收起
littlemagic 2018-03-23 18:17:06 3940 0
2 条回答
写回答
取消 提交回答
  • 如果只是分词的话建议直接用阿里分词

    2019-07-17 22:02:56
    赞同 展开评论 打赏
  • 在Import之前os.system("pip install your_library")试试

    2019-07-17 22:02:56
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
From Python Scikit-Learn to Sc 立即下载
Data Pre-Processing in Python: 立即下载
双剑合璧-Python和大数据计算平台的结合 立即下载