开发者:上海品职教育科技有限公司 隐私政策详情

应用版本:4.2.11(IOS)|3.2.5(安卓)APP下载

Kathy苏苏 · 2023年03月23日

没看懂

NO.PZ2022120201000007

问题如下:

What are the distinctions between the Monte Carlo and temporal difference methods for reinforcement learning?

选项:

解释:

The Monte Carlo method updates strategies using the total future rewards. Temporal difference learning looks only one decision ahead when updating strategies.

没看懂,麻烦讲解下,谢谢

1 个答案

pzqa27 · 2023年03月24日

嗨,爱思考的PZer你好:


这里就是问蒙特卡洛模拟和时序差分的区别,蒙特卡洛预测的未来是一个分布,而时序差分只能预测一步,详细原理同学可以参考下这个视频的这个时间

----------------------------------------------
加油吧,让我们一起遇见更好的自己!

  • 1

    回答
  • 0

    关注
  • 257

    浏览
相关问题