机器学习PAI执行Alink的job时,报错Caused by: com.alibaba.alink.common.exceptions.AkUnclassifiedErrorException: Cannot download file from https://alink-release.oss-cn-beijing.aliyuncs.com/deps-files/resources/libtorch_linux-1.8.1/libtorch-shared-with-deps-1.8.1-cpu.zip,已经使用AlinkGlobalConfiguration.setPluginDir()指定了plugins路径,并且路径下有对应的文件怎么办?
这个问题可能是由于网络连接问题导致的。您可以尝试以下方法解决:
检查您的网络连接是否正常,确保您可以访问 https://alink-release.oss-cn-beijing.aliyuncs.com/deps-files/resources/libtorch_linux-1.8.1/libtorch-shared-with-deps-1.8.1-cpu.zip 这个链接。
如果网络连接正常,您可以尝试手动下载该文件,并将其放到指定的插件路径下。然后再次运行Alink的job。
如果上述方法仍然无法解决问题,您可以尝试使用其他版本的libtorch,或者联系阿里云的技术支持寻求帮助。
您遇到的错误提示表明,机器学习平台PAI在执行Alink的job时,试图从指定的URL下载libtorch-shared-with-deps-1.8.1-cpu.zip
文件,但是没有成功。尽管您已经使用AlinkGlobalConfiguration.setPluginDir()
方法指定了插件路径,并且该路径下存在对应的文件,但平台可能仍然尝试从远程URL获取文件。
以下是您可以尝试的几个解决步骤:
检查网络连接:
确保您的PAI执行环境能够访问互联网,并且没有防火墙或网络策略阻止了对https://alink-release.oss-cn-beijing.aliyuncs.com
的访问。
检查配置文件:
检查您的Alink配置文件或PAI的Job配置,确保没有地方硬编码了远程URL,并且确实使用了您通过AlinkGlobalConfiguration.setPluginDir()
设置的本地路径。
确保文件完整性和路径正确:
确认您本地的libtorch-shared-with-deps-1.8.1-cpu.zip
文件是完整且未损坏的。同时,确保指定的插件路径是PAI执行Job时能够访问到的路径。
检查PAI和Alink版本兼容性:
确保您使用的PAI和Alink版本是兼容的,并且支持您想要使用的功能。如果版本不匹配,可能会导致一些意外的行为。
查看PAI或Alink文档和社区:
查阅PAI和Alink的官方文档,看看是否有关于如何配置本地插件或解决下载问题的说明。同时,也可以在相关的开发者社区或论坛中搜索是否有其他用户遇到过类似问题,并找到了解决方案。
联系技术支持:
如果以上步骤都无法解决问题,您可能需要联系PAI或Alink的技术支持,寻求专业的帮助。
考虑使用本地构建:
如果远程下载始终是一个问题,您还可以考虑从源代码本地构建Alink,这样您就可以完全控制所需的依赖项和它们的来源。
针对Alink在PAI上执行时下载依赖库失败的问题,先确认网络是否正常,能否访问指定的OSS地址。检查所设置的AlinkGlobalConfiguration.setPluginDir()
路径下是否包含了正确的libtorch库文件及其完整目录结构。若问题依然存在,可能需要检查是否有权限问题或者尝试重新下载依赖库文件到正确的位置。如果所有操作均无误,建议联系阿里云PAI团队寻求专业技术支持。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。