datawhalechina/easy-rl: 强化学习中文教程(蘑菇书 ... - GitHub
https://security.feishu.cn/link/safety?target=https://github.com/datawhalechina/easy-rl?from=from_parent_mindnote&scene=ccm&logParams=贡献者. pic · Qi Wang. 教程设计(第1~12章) 上海交通大学博士生中国科学院大学 ... 第二章马尔可夫决策过程(MDP) · 第二章习题 · 值迭代算法 · 第三章表格型方法 · 第三章 ...