开发者社区 问答 正文

机器的强化学习过程是怎样的?

机器的强化学习过程是怎样的?

展开
收起
罗鹏大佬 2021-12-14 18:50:46 695 分享 版权
来自: 阿里机器智能
1 条回答
写回答
取消 提交回答
  • 强化学习的基本要素为 State,Action,和 Environment。基本过程为:

    Environment 给出 State,Agent 根据 state 做 Action 决策,Action 作用在 Environment 上产生新的 State 及 reward,其中 reward 用来指导 Agent 做出更好的 Action 决策,循环往复….

    2021-12-14 18:53:23
    赞同 展开评论