为巩固RL算法的掌握程度,所以我打算写一个学习框架。测试自己写的算法是否正确以及观察算法的各种指标。既巩固了所学理论,又弥补了实战编程经验的不足,也会以后算法创新的仿真测试做了铺垫。所以我认为写这么一个学习框架性价比很高。
强化学习3
值函数近似(DQN)、策略梯度方法(REINFORCE)、Actor-Critic方法
强化学习2
值/策略迭代算法、蒙特卡洛、随机近似理论、时序差分方法
动手学强化学习
强化学习1
基本概念、MDP、贝尔曼公式、贝尔曼最优公式
微分方程2
复数、复化解一阶常系数线性ODE、二阶常系数齐次线性ODE、二阶齐次线性ODE相关理论、二阶非齐次线性ODE相关理论
操作系统自学笔记
文字、程序、图片来源包括但不限于蒋老师的课件、我OS/计组老师的课件、助教的实验文档、我的个人理解
机器学习课程自学笔记
参考内容:《机器学习》周志华
微分方程1
几何法解一阶ODE、欧拉数值法解一阶ODE、分离变量法解一阶ODE、解标准一阶线性ODE、换元法解伯努利方程+一阶齐次ODE、一阶自治ODE图像分析
线性代数4
总结、知识易混点整理、补充知识