问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

神经网络的训练可以采用二阶优化方法吗

发布网友 发布时间:2022-04-23 17:27

我来回答

1个回答

热心网友 时间:2023-07-02 00:28

1. 时间复杂度:使用二阶方法通常需要直接计算或者近似估计Hessian矩阵,这部分的时间损耗使得其相比一阶方法在收敛速度上带来的优势完全被抵消;
2. 某些非线性网络层很难(或不可能)使用二阶方法优化:如果这个情况为真,那是否可能针对每个网络层使用不同的优化方案,比如像Fully-Connected Layer这样的简单线性映射操作使用二阶方法,非线性网络层使用传统梯度下降方法?
3. 二阶方法容易被saddle points吸引,难以到达local minimal或者global minimal:NIPS 2014有篇论文([1406.2572] Identifying and attacking the saddle point problem in high-dimensional non-convex optimization)认为在高维情况下,神经网络优化最大的问题不是网络容易到达local minimal,而是容易被saddle points困住,因为在这种情况下,local minimal不管在loss值还是泛化能力上都与global minimal相差不大,反而是非常多的saddle points存在loss较高的空间中。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
吃干燥剂会有什么反应 干燥剂不慎食用怎么办 于冕被流放多少时间才回来 石羊场客运站坐几路公汽到成都市龙潭社区保平村九组? 从成都石羊场到龙潭寺北湖客运站做地铁公交咋个赶车呀?老师们_百度知 ... 成都理工大学坐车到石羊场客运站怎么走?大概要多久啊?谢谢!! 请问一下成都理工大学到石羊车站怎么做车啊? 还在盲目护理毛孔吗?如何正确护理毛孔? 毛孔粗大该如何处理? 脸t区毛孔粗大怎么办 毛孔粗大的原因是什么 腊八节相传至今为止多少年了? 腊八是什么节?意义是什么? 腊八节是什么节呀?有啥习俗、、、 哔哩哔哩求急 生死狙击进不去,黑屏。。。 哔哩哔哩正式会员问题,求大神解答~ 哔哩哔哩问题求答案! 4399生死狙击极速登录器一直停留在启动画面,很难进入游戏 为什么哔哩哔哩老是在五秒的时候卡,我难死了? 请问哪里可以下载到4399生死狙击登录器电脑版? 哔哩哔哩的问题求助! 4399生死狙击进不去??? 你觉得哔哩哔哩的用户体验怎么样? 4399生死狙击怎么进不去一直是正在登录 哔哩哔哩今年上市,他是怎么将公司做得这么大的? 哔哩哔哩的问题,急,在线等 魔王是个宅的作品目录 我下载了哔哩哔哩的客户端,但经常视频点进去后会死机,然后自动重启。这是为什么? 为什么4399生死狙击登陆界面显示不出来 电脑独立声卡那个品牌好? 我梦见自己同死去的爷爷聊天-为什么 想知道优化算法是什么? 100维度用什么优化算法 翻新机耗电和新机耗电有多大差别 梦见和死去的爷爷对话! 牛顿法为什么比梯度下降法求解需要的迭代次数更少? 梯度下降法是万能的模型训练算法吗? 梦见死去很久的爷爷和我说话(以前从没梦见过) 有什么寓意吗?求解 数学题求助,拉格朗日乘子法求解最优化问题和求函数的梯度向量和二阶海塞矩阵。如下图。 什么是最优化 翻新机与原装机有什么区别? 找出以下函数的一阶偏导数和二阶偏导数? 国家公祭日有哪些活动? 速度梯度怎么计算呢? 您好!我想问一下我要怎么制定股东相互制约的协议,就比如不能*私用 翻新机是什么意思?跟普通的手机有什么区别么? 梦见死去的爷爷跟我说话,我害怕躲起来 2021年12月13日是第几个国家公祭日 为什么 空间二阶导(拉普拉斯算子)这么重要? 解梦!梦到死去的爷爷和自己说话。