人工智能平台PAI 操作报错合集之在PAI-DSW（平台上的AI数据科学工作站）上尝试修改实例名时，收到"实例不存在"的错误信息如何解决-阿里云开发者社区

人工智能平台PAI 操作报错合集之在PAI-DSW（平台上的AI数据科学工作站）上尝试修改实例名时，收到"实例不存在"的错误信息如何解决

2024-04-28 377

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

模型训练 PAI-DLC，5000CU*H 3个月

交互式建模 PAI-DSW，每月250计算时 3个月

简介： 阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台，旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时，可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。

问题一：机器学习PAI其实我第一步export步骤导出来的*.pb模型，这可能是什么情况呢？

机器学习PAI其实我第一步export步骤导出来的*.pb模型，和第二步evaluate载入的ckpt的模型，几乎就是一个模型，所以理论上evaluate加不加Dcheckpoint参数应该evaluate出来结果没有太大区别，但是实际上recall@topk评估参数等价一个训练了一个没训练，这可能是什么情况呢？

参考答案：

同一个ckpt，直接用ckpt evaluate，其结果与将同一个ckpt导出为model再evalue结果不同。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/573247

问题二：机器学习PAI这个逻辑不对啊?

机器学习PAI这个逻辑不对啊?给ckpt报bug：

我理解saved_model_dir里一定要有*.pb文件是吗？

参考答案：

predict 的时候参数是 saved_model_dir , 可以按文档来：https://easyrec.readthedocs.io/en/latest/predict/MaxCompute%20离线预测.html

是的，里面的目录结构一般是下面的：

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/573246

问题三：机器学习PAI export模型时，第三步一直卡在waiting状态，是什么问题？

机器学习PAI export模型时，第三步一直卡在waiting状态，是什么问题？也不报参数错误。

参考答案：

集群好像没有资源了,你把这个任务的cpu 减少一点重跑一下吧,export任务比较轻量，不需要那么多cpu

memory也适当减少

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/573244

问题四：请教下，机器学习PAI-dsw修改实例名，报错实例不存在是什么原因呢？

请教下，机器学习PAI-dsw修改实例名，报错实例不存在是什么原因呢？

参考答案：

当你在PAI-DSW（平台上的AI数据科学工作站）上尝试修改实例名时，如果收到"实例不存在"的错误信息，可能有以下几种原因：

你可能尝试修改的实例并不存在。请确认你要修改的实例名称是否正确。
你可能没有权限修改这个实例。请确认你是否具有修改这个实例的权限。
系统错误：有时，系统可能会出现一些错误，导致你不能修改实例名。

建议你首先确认你要修改的实例是否存在，然后检查你是否具有修改这个实例的权限。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/571656

问题五：机器学习PAI杭州region，一直处于等待中，但没有报错信息?

机器学习PAI杭州region，eas-r-47qo07i1woxu7fqmos资源组，机器规格ml.gu7i.c8m30.1-gu30

部署了服务indvi_e6a21f123113434e8839ba71d2f0f63c，

一直处于等待中，但没有报错信息?辛苦帮忙看下哈

参考答案：

从你提供的信息来看，你可能在阿里云PAI（平台上的AI）上部署了一个名为"indvi_e6a21f123113434e8839ba71d2f0f63c"的服务。这个服务在杭州的region（数据中心），使用的是"eas-r-47qo07i1woxu7fqmos"资源组，机器规格为"ml.gu7i.c8m30.1-gu30"。

关于你的服务状态一直显示为"等待"，这可能是因为以下几种情况：

资源不足：如果你的资源组中的资源已经被其他服务占用，那么新的服务可能需要等待资源释放后才能启动。
网络问题：如果你的服务需要与其他服务或者数据源进行通信，那么网络问题可能会导致服务无法启动。
系统问题：有时候，系统可能会因为一些未知的原因导致服务无法正常启动。

建议你首先查看一下资源组的资源使用情况，看看是否有资源被占用。其次，你可以检查一下服务的日志，看看是否有报错信息。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/571654

人工智能平台PAI 操作报错合集之在PAI-DSW（平台上的AI数据科学工作站）上尝试修改实例名时，收到"实例不存在"的错误信息如何解决

问题一：机器学习PAI其实我第一步export步骤导出来的*.pb模型，这可能是什么情况呢？

问题二：机器学习PAI这个逻辑不对啊?

问题三：机器学习PAI export模型时，第三步一直卡在waiting状态，是什么问题？

问题四：请教下，机器学习PAI-dsw修改实例名，报错实例不存在是什么原因呢？

问题五：机器学习PAI杭州region，一直处于等待中，但没有报错信息?

人工智能平台PAI

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景