问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

机器学习·总览篇 V 三要素之模型

发布网友 发布时间:2024-10-02 17:04

我来回答

1个回答

热心网友 时间:2024-10-04 03:01

上一篇文章对机器学习的三要素——模型、策略、算法进行了初步介绍,但并未深入探讨。本文将专注于模型这一要素,深入探讨不同模型之间的区别。本文首发于我的知乎专栏《机器怎么学习》中的《机器学习·总览篇(5) 三要素之模型》,转载请保留链接。

在机器学习中,首先需要确定学习什么样的模型。如前文所述,模型就是所要学习的条件概率分布或决策函数。模型的假设空间包含所有可能的条件概率分布和决策函数,通常是无限多种可能性。而训练的目的就是获取一个最优参数的模型。

一、非概率模型、概率判别模型、生成模型
模型通常有两种分类方式:第一种是按模型形式分类:概率模型(Probabilistic Model)和 非概率模型(Non-probabilistic Model);第二种是按是否对观测变量的分布建模分类:判别模型(Discriminative Model)和 生成模型(Generative Model)。这两种分类方法实际上将所有模型划分为三类,如图1所示。

图1清楚地表示了三种模型:非概率模型(Non-probabilistic Model)、概率判别模型(Probalilistic Discriminative Model)和生成模型(Generative Model)。非概率模型和概率判别模型同属于判别模型,概率判别模型和生成模型同属于概率模型。接下来,我们来分析这三种模型。

I. 非概率模型(Non-probabilistic Model):直接对输入空间到输出空间的映射y=h(x)建模。实例:感知机(单层神经网络,Perceptron)、多层感知机(MLP)、支持向量机(SVM)、K近邻(KNN)

II. 概率判别模型(Probalilistic Discriminative Model):直接对后验概率P(y|x)建模,然后实现分类。实例:逻辑回归(LR)、最大熵模型(ME)、条件随机场(CRF)

III. 生成模型(Generative Model):对联合概率P(x,y)建模。如果是在聚类任务中,到这一步就结束了;但如果在分类任务中,再根据贝叶斯公式算出条件概率P(y|x),最后实现分类。实例:高斯判别分析(GDA)、朴素贝叶斯(NB)、受限玻尔兹曼机(RBM)、隐马尔科夫模型(HMM)

1.1 非概率模型(I)和概率判别模型(II)
两者共同点是都是判别模型,如图2所示。

图2是判别模型的分类示意图,非概率模型和概率判别模型的共同点是对判别标准直接建模,都是与图中的线一样判别(划分)数据。

非概率模型和概率判别模型的差别是判别数据的标准不一样,具体如下,

1.2 生成模型(III)
生成模型与上述两种模型(判别模型)的差别是生成模型在类内对联合概率分布的建模,以此为基础再做分类,如图3所示。

相比与图3中所示的生成模型对联合概率分布建模,而非概率模型和概率判别模型都没有对类内联合概率分布建模这一步。

1.3 小结
Stackoverflow上,有一个的简单例子能很好地说明以上三种模型的特点。假设特征x是1维,并且值只有1和2可选;标签y的也是1维,且值只有0和1可选,现在有如下 (x,y) 形式的4个样本 - (1,0)、(1,0)、(1,1)、(2, 1),则学习到的联合概率分布如下:

这个联合概率分布就是生成模型的直接建模目标。而学习到的条件概率分布如下:

这个条件概率分布就是概率判别模型的直接建模目标。而学习到的直接映射如下:

这个分类标准就是非概率模型的建模目标。可以很清楚地看到三种模型信息量从多到少:生成模型 > 概率判别模型 > 非概率模型。更全面的总结可用表示为,

二、线性模型和非线性模型
x是模型函数的自变量,y是模型函数的因变量,上文中对于生成模型和判别模型本质差别是对于y是间接求解还是直接求解,对于概率模型和非概率模型的本质差别是y的表示形式,而在本小节中,我们还可以根据y与x的关系来区分线性模型和非线性模型。

2.1 线性模型
典型的线性模型有线性SVM和感知机(单层NN),两者都可以用y=wx+b的形式表示,y与x的关系是线性的;进行分类任务时,数据的判别分割界面都是线性平面。

对于逻辑回归模型,y=sigmoid(wx+b),y与x的关系是非线性的;然而,进行分类任务时,数据的分割界面仍然是线性平面。逻辑回归模型实际上我们称之为广义线性模型(Generalized Linear Model,GLM),GLM是线性模型的扩展,逻辑回归模型是y服从伯努利分布下的GLM;线性模型也可以看成是一种特殊的GLM,可以看成是y服从高斯分布下的GLM。GLM通过采用对应的联系函数针对不同y分布的数据,让y的取值范围与预测值范围一致,以及让模型比较好地拟合当下的数据。

其实,在统计意义上,如果一个回归方程是线性的,那么它的相对于参数就必须也是线性的;如果方程相对于参数是线性,那么即使性对于样本变量的特征是二次方或者多次方,这个回归模型也是线性的。所以广义线性模型本质上还是线性模型。后面会在有监督学习篇中详细介绍广义线性模型。

2.2 非线性模型
以上常见的线性模型通过特定的非线性变换,可以成为处理非线性可分数据的非线性模型,

还有一些常见的天然非线性模型,如KNN、决策树(DT)、随机森林(RF)、GBDT等。另外,朴素贝叶斯模型用于分类时,假设对于每一维x和每一类y,x|y 条件概率满足高斯分布:任意维x在不同类别y下,如果 x|y 分布的方差都相等,则是线性分类器;如果 x|y 的方差不同,则是非线性分类器,具体分析可参考《朴素贝叶斯分类器本质上是线性分类器》一文。

参考文献
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
...最好是粉蓝绿之类的 大屏幕 前后摄像头 三星HTC索爱等都可 不要... ...3000左右的机子,htconex的水货怎么样与三星i9100比哪个更好一点,适... 私密照片适用机型 ...看上了三星的i9100和HTC的g19和索尼lt26 不知道选择哪一部 求大神... ...全部歌词?歌词大概……那是一个夜晚……我和谁谁媳妇缠绵…_百度知 ... 老年人缺铁性贫血有哪些症状 酪梨虾是什么 诺基亚C7无法使用OVI套件在电脑上升级地图。 我用ovi套件更新软件总手机重启后提示连接失败,跪求高人指点。。。_百... 我nokia2730c用ovi套件升级成v7.75版,结果变成全英文(设置语言修改没用... ...水乳精华面霜眼霜的涂抹顺序是什么啊?有的人说最先涂抹精华,有... ...样的?求解答*罒▽罒*~一只洁面乳,亮肤水,菁华露,晚霜,精华露... ...安和新加坡航空的联程机票。我想知道有关行李托运的事? 从成都到普吉亚航联程机票托运费怎么收 联程机票和托运问题 联程机票 托运 找一本看过的小说名字 玄幻类的 男主是亡灵法师之类的 到了异界 带很... 程光是如何通过节目推动出租车司机与警方合作打击犯罪的? 在钉钉上和同事聊天,领导能看见私聊吗 军工股票与军工指数基金有什么区别 为什么数字电视显示e1104 什么费用不用计提折旧 请问长城环球通信用卡白金卡和金卡有什么区别? 家庭版蒜香烤蘑菇怎么做才好吃? 如何让文本框的文字居中对齐? 怎样让文字在Word2010文档正中间显示? 减肥可以吃零食的吗 减肥的时候不建议吃零食 我想问下,招商银行信用卡普卡和VISA普卡额度一样吗,都是多少额度!谢谢... ...今天我去花鸟鱼市场溜达 听说这种高筒花盆里面不全是土 卖家为了省... 减肥到底能不能吃零食 戒了主食就能减肥吗 机器学习(一)线性模型———理论篇 线性回归模型、对数几率模型、线性... 乌鱼可以用来做酸菜鱼吗 ...那EMS的飞机上有乘客吗?还是说这东西只用来寄东西? 怎样烹饪乌鱼酸菜才能保持它鲜美的口感? 酸菜乌鱼花应该如何制作? 腌的泡菜才一天就好多泡怎么办?是有油吗?速度求解! 墨兰上盆种植15天己长新叶芽正E常吗? 网球女单决赛是几点 7月 10 日温网女单决赛,莱巴金娜首夺大满贯女单冠军,如何 酸菜乌鱼汤该怎么做? 烹饪乌鱼的方法有哪些? 乌鱼有哪些家常做法值得分享? 乌鱼的家常做法有哪些? 有什么乌鱼的做法大全分享? 乌鱼的做法大全家常 乌鱼有哪些吃法可以推荐? 炒乌鱼片有什么简单做法? 炒乌鱼片的做法教程有哪些? 我的手机进入recovery后没有双清 没有install zip from sdcard怎么刷 ... 那个我的手机没有“install zip from sdcard”这个选项