Reinforcement Learning Day 3 (Finite Markov Decision Processes)
- Return, Policy and Value Function
- Optimal Policies and Optimal Value Functions
- Coursera False Questions
- Optimality and Approximation
- Summary
最近又再捣鼓捣鼓自己HKKB的键盘,一直没有整明白自己的HHKB后面那一串开关的用处,后面写了一串英文介绍也没弄懂是怎么使用。经过仔细探究发现主要要的三个用途。