问题一:机器学习PAI flink运行一段时间后jobManager里经常会报这个错是什么原因?
机器学习PAI flink运行一段时间后jobManager里经常会报Connection reset by peer这个错是什么原因?
参考答案:
可能是cpu或者内存超了
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/586588
问题二:机器学习PAI本地执行web ui的时候报这个错,能帮忙看看是什么原因吗?还是我配置有问题
机器学习PAI本地执行web ui的时候报这个错,能帮忙看看是什么原因吗?还是我配置有问题
参考答案:
根据您提供的错误信息,问题可能出在以下几个方面:
- 网络连接问题:请确保您的本地计算机可以访问PAI的Web UI。检查您的网络设置和防火墙配置,确保没有阻止您访问8080端口。
- 权限问题:请确保您具有足够的权限来执行机器学习任务。如果您没有足够的权限,请联系您的系统管理员或PAI管理员以获取帮助。
- 资源限制:请检查您的计算机是否有足够的资源(如内存、CPU等)来执行机器学习任务。如果资源不足,您可能需要升级您的硬件或优化您的代码以减少资源使用。
- 代码错误:请检查您的代码是否存在错误。您可以查看PAI Web UI中的日志以获取更多关于错误的详细信息。
- PAI版本问题:请确保您使用的PAI版本与您的代码兼容。如果您使用的是较旧的版本,您可能需要升级到最新版本。
建议您尝试以上方法解决问题,如果问题仍然存在,请查阅PAI官方文档或联系PAI技术支持以获取更多帮助。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/586587
问题三:机器学习PAI的EasyRec在使用DLC做分布式训练时得到如下错误怎么解决?
机器学习PAI的EasyRec在使用DLC做分布式训练时得到如下错误怎么解决?
参考答案:
oss挂载写events文件有问题,只能close的时候才会创建这个文件,可以先尝试用nas走通看看吗?我们再看怎么解决DLC挂载oss跑EasyRec的问题,主要是oss本身不支持标准的POSIX文件接口
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/586363
问题四:安装了最新版本机器学习PAI的easy_rec,为啥调用的时候,就会这样啊?
安装了最新版本机器学习PAI的easy_rec,为啥调用的时候,就会这样啊?>>> import easy_rec as ec
Traceback (most recent call last):
File "", line 1, in
File "/Users/caonannan/miniforge3/envs/tf/lib/python3.9/site-packages/easy_rec-0.7.4-py3.9.egg/easy_rec/init.py", line 37, in
from easy_rec.python.inference.predictor import Predictor # isort:skip # noqa: E402
File "/Users/caonannan/miniforge3/envs/tf/lib/python3.9/site-packages/easy_rec-0.7.4-py3.9.egg/easy_rec/python/inference/predictor.py", line 23, in
from easy_rec.python.protos.dataset_pb2 import DatasetConfig
ModuleNotFoundError: No module named 'easy_rec.python.protos.dataset_pb2'
参考答案:
原因是没有运行初始化脚本。请执行sh scripts/init.sh来解决该问题。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/586356
问题五:PAI报这个错是为什么?Error info is "log_vml_cpu" not implem
PAI报这个错是为什么?Error info is "log_vml_cpu" not implemented for 'Half'
参考答案:
重启一下webui 再做推理哈
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/585734
问题六:PAI有资源却报错,无法提交怎么解决?
PAI有资源却报错,无法提交怎么解决?
参考答案:
因为资源库存实时更新的,所以可能创建时候会失败,麻烦您换一下region或者刷新尝试一下呢
关于本问题的更多回答可点击进行查看: