转载

发表于 2016年08月21日
浏览 (832)
评论 (0)

Yoshua Bengio论文：Mollifying Networks

Yoshua Bengio论文：Mollifying Networks

摘要

深度神经网络的优化要比传统的凸优化问题（convex optimization problem）更具挑战性，这是由于损失函数的高度非凸特性，比如：其可能涉及鞍表面（saddle-surface）这样的病理学图景（pathological landscapes），而鞍表面对基于简单梯度下降的算法来说是难以逃逸（escape）的。在这篇论文中，我们通过从一个平滑的——即 mollified ——目标函数开始尝试解决高度非凸的神经网络的优化问题，该目标函数会随训练过程变得越来越复杂。我们提议的方法受到了最近的延拓法（continuation method）研究的启发，该方法类似于课程方法（curriculum method）——我们开始时学习一个更轻松（可能是凸的）目标函数，然后让其在训练过程中进化，直到它最终变回原来的难以优化的目标函数。mollified network 的复杂性受控于训练过程中退火的（annealed）的单个超参数。我们的结果在多种不同的优化任务上实现了提升，并将用于神经网络的延拓法和 mollifier 两者的最近成果联系了起来。

论文地址： Mollifying Networks

原文 http://www.jiqizhixin.com/article/1420

正文到此结束

所属分类：编程技术

本文标签： ACE http DDL src 参数 UI 神经网络
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(15,030) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,293) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,094) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,993) 评论(0)
Decorators in ES7

浏览(16,613) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,577) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(13,023) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,934) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,083) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,235) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG