开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

问一个关于机器学习API的问题,对于ps-worker模式,worker是同步训练还是异步训练呢?

对于ps-worker模式,worker是同步训练还是异步训练呢?

展开
收起
游客242jp2lsd3dac 2023-04-17 18:49:49 401 0
2 条回答
写回答
取消 提交回答
  • 公众号:网络技术联盟站,InfoQ签约作者,阿里云社区签约作者,华为云 云享专家,BOSS直聘 创作王者,腾讯课堂创作领航员,博客+论坛:https://www.wljslmz.cn,工程师导航:https://www.wljslmz.com

    在阿里云机器学习PAI上使用ps-worker模式进行分布式训练时,worker节点可以实现异步训练。具体的来说,worker会在收到参数更新后立即进行训练,并将自己的参数更新发送给ps节点,而不必等待其他worker节点的训练结果。

    使用异步训练可以在一定程度上提高分布式训练的效率,因为每个节点可以独立地更新参数,并不需要等待其他节点完成训练。但是,异步训练也可能会导致训练过程中的参数不稳定,甚至会影响训练结果的质量。因此,具体使用哪种训练方式,需要根据您的具体业务场景和数据特点来确定。

    在使用ps-worker模式进行分布式训练时,您可以根据需要调整worker节点的数量和训练参数,以达到最佳的训练效果。同时,您还可以在PAI平台上进行可视化的监控和调试,帮助您更好地理解和优化训练过程。

    2023-04-30 10:30:33
    赞同 展开评论 打赏
  • 都可以,但如果想跑同步训练,肯定是建议用collective方式来跑。此回答整理自钉群DeepRec用户群

    2023-04-17 21:39:05
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

相关产品

  • 人工智能平台 PAI
  • 热门讨论

    热门文章

    相关电子书

    更多
    大规模机器学习在蚂蚁+阿里的应用 立即下载
    阿里巴巴机器学习平台AI 立即下载
    微博机器学习平台架构和实践 立即下载