暂停更新的意思是,大幅降低更新频率了,可能偶尔兴致来了会再写点东西。
机器学习自学笔记
看学校ppt + 西瓜书的一些总结
RL代码学习框架
为巩固RL算法的掌握程度,所以我打算写一个学习框架。测试自己写的算法是否正确以及观察算法的各种指标。既巩固了所学理论,又弥补了实战编程经验的不足,也会以后算法创新的仿真测试做了铺垫。所以我认为写这么一个学习框架性价比很高。
强化学习3
值函数近似(DQN)、策略梯度方法(REINFORCE)、Actor-Critic方法
强化学习2
值/策略迭代算法、蒙特卡洛、随机近似理论、时序差分方法
强化学习1
基本概念、MDP、贝尔曼公式、贝尔曼最优公式
微分方程2
复数、复化解一阶常系数线性ODE、二阶常系数齐次线性ODE、二阶齐次线性ODE相关理论、二阶非齐次线性ODE相关理论
微分方程1
几何法解一阶ODE、欧拉数值法解一阶ODE、分离变量法解一阶ODE、解标准一阶线性ODE、换元法解伯努利方程+一阶齐次ODE、一阶自治ODE图像分析
线性代数4
总结、知识易混点整理、补充知识
线性代数3
对称矩阵、复数矩阵、FFT、正定矩阵、相似矩阵、SVD分解、线性变换、图像压缩、左右逆/伪逆