开发者学堂课程【PAL 平台学习路线:机器学习入门到应用:如何使用 studio 查看 logview 并进行日志分析】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/855/detail/14246
如何使用 studio 查看 logview 并进行日志分析
内容介绍:
一、登录使用 studio 并查看 logview
二、对 logview 内容进行日志分析
一、登录使用 studio 并查看 ogview
登录 PAI studio 控制台,在 AI 工作空间列表中点击新建 AI 工作空间创建一个项目,输入基本信息的过程中,如果要使用类似 Tensorflow 这样的深度学习框架的话,要开通 GPU。在 studio 里选择刚刚创建的项目进入机器学习。主要使用 Tensorflow 图片分类模板作为示例。
读 OSS 数据-1为训练数据集,读 OSS 数据-2为测试数据集,TensorFlow-1 为 Tensorflow 的算法组件,需要在TensorFlow-1 中选择训练完成的模型在 OSS 的落库地址。单击 TensorFlow-1 右键选择运行该节点,在运行过程中可以选择查看日志,点击日志中 logview 的连接地址,其中 ps 负责参数管理,worker 代表参数计算的几个工作节点。
二、对 logview 内容进行日志分析
用户可以在实验界面点击执行调优来选择 worker GPU 卡数、指定 worker 个数及指定 ps 个数。选择 StdOut 可以看见训练过程中各种参数的变化,例如loss 数越小,指模型越收敛,预测结果越准确。如果运行中报错会在StdErr 中显示。Debug 会再次选出错误的部分。