问题一:机器学习PAI其实我第一步export步骤导出来的*.pb模型,这可能是什么情况呢?
机器学习PAI其实我第一步export步骤导出来的*.pb模型,和第二步evaluate载入的ckpt的模型,几乎就是一个模型,所以理论上evaluate加不加Dcheckpoint参数应该evaluate出来结果没有太大区别,但是实际上recall@topk评估参数等价一个训练了一个没训练,这可能是什么情况呢?
参考答案:
同一个ckpt,直接用ckpt evaluate,其结果与将同一个ckpt导出为model再evalue结果不同。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/573247
问题二:机器学习PAI这个逻辑不对啊?
机器学习PAI这个逻辑不对啊?给ckpt报bug:
我理解saved_model_dir里一定要有*.pb文件是吗?
参考答案:
predict 的时候参数是 saved_model_dir , 可以按文档来:https://easyrec.readthedocs.io/en/latest/predict/MaxCompute%20离线预测.html
是的,里面的目录结构一般是下面的:
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/573246
问题三:机器学习PAI export模型时,第三步一直卡在waiting状态,是什么问题?
机器学习PAI export模型时,第三步一直卡在waiting状态,是什么问题?也不报参数错误。
参考答案:
集群好像没有资源了,你把这个任务的cpu 减少一点重跑一下吧,export任务比较轻量,不需要那么多cpu
memory也适当减少
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/573244
问题四:请教下,机器学习PAI-dsw修改实例名,报错实例不存在是什么原因呢?
请教下,机器学习PAI-dsw修改实例名,报错实例不存在是什么原因呢?
参考答案:
当你在PAI-DSW(平台上的AI数据科学工作站)上尝试修改实例名时,如果收到"实例不存在"的错误信息,可能有以下几种原因:
- 你可能尝试修改的实例并不存在。请确认你要修改的实例名称是否正确。
- 你可能没有权限修改这个实例。请确认你是否具有修改这个实例的权限。
- 系统错误:有时,系统可能会出现一些错误,导致你不能修改实例名。
建议你首先确认你要修改的实例是否存在,然后检查你是否具有修改这个实例的权限。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/571656
问题五:机器学习PAI杭州region,一直处于等待中,但没有报错信息?
机器学习PAI杭州region,eas-r-47qo07i1woxu7fqmos资源组,机器规格ml.gu7i.c8m30.1-gu30
部署了服务indvi_e6a21f123113434e8839ba71d2f0f63c,
一直处于等待中,但没有报错信息?辛苦帮忙看下哈
参考答案:
从你提供的信息来看,你可能在阿里云PAI(平台上的AI)上部署了一个名为"indvi_e6a21f123113434e8839ba71d2f0f63c"的服务。这个服务在杭州的region(数据中心),使用的是"eas-r-47qo07i1woxu7fqmos"资源组,机器规格为"ml.gu7i.c8m30.1-gu30"。
关于你的服务状态一直显示为"等待",这可能是因为以下几种情况:
- 资源不足:如果你的资源组中的资源已经被其他服务占用,那么新的服务可能需要等待资源释放后才能启动。
- 网络问题:如果你的服务需要与其他服务或者数据源进行通信,那么网络问题可能会导致服务无法启动。
- 系统问题:有时候,系统可能会因为一些未知的原因导致服务无法正常启动。
建议你首先查看一下资源组的资源使用情况,看看是否有资源被占用。其次,你可以检查一下服务的日志,看看是否有报错信息。
关于本问题的更多回答可点击进行查看: