问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

牛顿法为什么比梯度下降法求解需要的迭代次数更少?

发布网友 发布时间:2022-04-22 04:38

我来回答

1个回答

热心网友 时间:2023-11-21 21:23

凸优化主要学习《凸优化》(Stephen Boyd等著,王书宁等译)[1]这本书。学习过程中,对其内容的理解时有困惑,也参考一些其他书籍资料。笔者尽量将这部分知识整理地简洁明了,成此系列笔记。

用目标函数的二阶泰勒展开近似该目标函数,通过求解这个二次函数的极小值来求解凸优化的搜索方向。

这从另一个角度揭示了为什么Newton步径是好的搜索方向了。

这里我没有去查找证明过程,我觉得只要知道就可以了,因为这有助于理解最速下降方法(《凸优化(六)——最速下降法》)。

在实际应用中,牛顿法往往比梯度下降法有更少的迭代次数。

2.2已经从一个角度说明了Newton步径是好的搜索方向。

知乎问答《最优化问题中,牛顿法为什么比梯度下降法求解需要的迭代次数更少?》[2]这篇也讲了一些,其中,排名第一的引自Wiki的“从几何上说,牛顿法就是用一个二次曲面去拟合你当前所处位置的局部曲面,而梯度下降法是用一个平面去拟合当前的局部曲面,通常情况下,二次曲面的拟合会比平面更好,所以牛顿法选择的下降路径会更符合真实的最优下降路径”,比较有说服力和概括性。

图2形象地说明了牛顿法和梯度下降法的区别,红色为牛顿方法搜索路径,绿色为梯度下降法搜索路径。

牛顿法需要计算目标函数Hessian矩阵的逆矩阵,运算复杂度太高,计算效率很低,尤其维数很大时。拟牛顿算法的核心思想用一个近似矩阵替代逆Hessian矩阵。

[1]、《凸优化》,Stephen Boyd等著,王书宁等译

[2]、 《最优化问题中,牛顿法为什么比梯度下降法求解需要的迭代次数更少?》

凸优化(一)——概述

凸优化(二)——凸集

凸优化(三)——凸函数

凸优化(四)——问题求解

凸优化(五)——回溯直线搜索

凸优化(六)——最速下降法

凸优化(七)——牛顿法

凸优化(八)——Lagrange对偶问题

2016-08-08 第一次发布
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
血浆,血液,血细胞的包含关系 新加坡华人宗教信仰 大雨天气开车开什么灯? 雨天行车用什么灯? 治安卡口系统设计,生产,安装标准依据 GB 4785 2007 GB4785-2007标准学习 ...母:高静。请各位取名。最好三个字(带雨字头、三点水最好)取两个... 自体脂肪面部填充效果好吗? iPad mini的屏幕问题 在R里应用梯度下降方法gradient descent 机器学习故事汇-梯度下降 随机梯度下降算法的相关应用 上海有哪些小额投资理财公司 上海有哪些做股票的公司? 我微信朋友圈的头像为什么看不见 手机上微信看不到朋友头像是什么情况 手机微信聊天怎么看不到自己的头像 怎样用色彩范围抠图 在PS里面怎么用色彩分离抠图 coreldraw中如何用提取颜色的方法抠图 图片抠图一般有哪几种类型的边缘?各使用什么方法将... ps怎样抠图补色 ps色彩相近怎么抠图 ps的利用颜色怎么抠图 photoshop怎样按颜色抠图 pr怎么根据颜色抠图 简述水浴式灭菌器的结构和原理? 实验室仪器设备的配置原则? 水质分析仪的水质指标 梯度下降法和粒子群优化算法的区别 随机并行梯度下降算法的算法流程 手表表盘可以自己换吗 数据统计学习的5个基本流程 我的手表表带,表面一层是帆布的,里面一层是皮带... 优化算法有哪些 怎样换手表表盘 关于机器学习应用不得不思考哪些问题? 实际工程中的优化算法主要有哪些 国家卫生城市考核命名和监督管理办法的内容 手表怎么换镜面 用什么工具 操作步骤是什么? 常见的监督学习算法 手表机芯如何更换 少食多餐怎么操作? 手表带更换如何知道它的尺寸 图像处理中应用的寻优算法有哪些 黑龙江省基层医疗卫生机构实施绩效工资试点考核办法 白菜的做法有多少种 减肥少食多餐怎么吃? 什么是反向传播算法