雷哥的博客


  • 首页

  • 分类

  • 归档

  • 标签
好! 目前共计 66 篇日志。 继续努力。

2019

简单推荐模型之二:基于相似信息的推荐模型

02-24

简单推荐模型之一:基于流行度的推荐模型

02-23

强化学习现状与未来

02-22

基于模型的学习和规划

02-03

基于策略梯度的深度强化学习

02-02

价值函数的近似表示

02-01

不基于模型的控制

01-31

不基于模型的预测

01-28

动态规划寻找最优策略

01-24

马尔科夫决策过程

01-21
1234…7
雷哥

雷哥

不积跬步无以至千里

66 日志
18 分类
16 标签
GitHub
© 2019 雷哥
由 Hexo 强力驱动
主题 - NexT.Gemini