转载

发表于 2016年04月08日
浏览 (2,240)
评论 (0)

DeepMind团队的《Deep Reinforcement Learning in Large Discrete Action Spaces》

Paper: Deep Reinforcement Learning in Large Discrete Action Spaces

Authors: G Dulac-Arnold, R Evans, H v Hasselt, P Sunehag, T Lillicrap, J Hunt, T Mann, T Weber, T Degris, B Coppin

Link： http://arxiv.org/abs/1512.07679

前阵刚炒作过AlphaGo的DeepMind本月4号更新了《Deep Reinforcement Learning in Large Discrete Action Spaces》第二版，看起来真的将RL用在推荐系统了。

不过看起来文章的最大创新只是引入了action embedding，具体如何做embedding的并未展开，估计是离不开word2vec的。文章提出了如图所示的Wolpertinger Policy网络，然后用Deep Deterministic Policy Gradient (DDPG)进行训练。最后的实验没看到大的突破，目前还是花招，期待未来更大的突破。

DeepMind团队的《Deep Reinforcement Learning in Large Discrete Action Spaces》

原文 https://www.52ml.net/17118.html

正文到此结束

所属分类：编程技术

本文标签： 突破 https 文章 web ACE rmi Word http src HTML
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,961) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,236) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,039) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,941) 评论(0)
Decorators in ES7

浏览(16,557) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,530) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,974) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,890) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,038) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,189) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG