开发者社区> 问答> 正文

模拟器就是user simulator主要分为哪三大块?

模拟器就是user simulator主要分为哪三大块?

展开
收起
张柠檬 2022-05-14 12:29:39 2104 0
来自:阿里技术
1 条回答
写回答
取消 提交回答
  • 一个是 user model,用来模拟人的行为的;第二个是 error model,模拟完人的行为以后经过 error model 引入一个错误扰动,用 user model 产出的只是一个概率为 1 的东西;第三个模块是 reward model,用来提供 reward 值。

    2022-05-14 15:10:03
    赞同 展开评论 打赏
问答地址:
来源圈子
更多
收录在圈子:
+ 订阅
问答排行榜
最热
最新

相关电子书

更多
Architecting a Multi-Tenanted Platform 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载