问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

day03-二分类问题

发布网友 发布时间:2023-02-10 11:11

我来回答

1个回答

热心网友 时间:2024-11-07 11:11

输入变量X和输出变量Y有不同类型,可以连续,可以离散。根据输入输出变量的不同类型,对预测人物给予不同的名称。输入输出变量均为连续变量的预测问题称为回归问题;输出变量为有限个离散变量的预测问题称为分类问题;输入输出变量均为变量序列问题称为标注问题

二分类问题就是简单的“是否”,“有无”问题,例如输出变量为0或1。

1、准确率
2、混淆矩阵
3、精准率、召回率、F1_score
4、auc
5、logloss

1、逻辑回归
2、svm
3、决策树
4、随机森林
5、Adaboost
6、xgboost
7、lightgbm
8、catboost
9、朴素贝叶斯

1.1 线性回归原理
概念:
线性回归是一种通过线性组合来进行预测的线性模型,其目的是找到一条直线或者一个平面或者更高维度的超平面,使得预测值与真实值之间的误差最小化。
线性回归:

线性回归是通过数据在N维空间找到h(x)来描述这些规律,这个过程称为拟合。h(x)的预测值与真实值会有偏差,也称为残差。线性回归一般使用残差的平方来计算损失,即损失函数为:

优缺点:
优:权重w是每个变量x的权重,通过w的大小可以看出每个x的重要性,有很好的解释性
缺:非线性数据拟合不好

1.2 逻辑回归原理
从1.1中可知,h(x)预测值是连续的,是一个回归模型。但是如果我们希望输出是离散的,则需要将h(x)进行一个函数转换,变成g(Y),其中g(Y)中的某些值属于类别1,另外的属于其他类别,这样的模型则为二分类模型。
此时g可以为:

g函数也被称为sigmoid函数。
当sigmoid函数计算出的值大于0.5的归为类别1,小于0.5的归为类别0
假设预测真实样本为1的概率为pi,则预测真实样本为0的概率为1-pi,那么预测概率为:

使用随机梯度下降优化损失函数:
损失函数:
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
对自己的前途怎么看? 开封哪里卖台球桌 范县新区哪里有卖麻将的 如何访问soutong防屏蔽网站 如何查看被屏蔽的属性? 商南有建设银行是真的吗? 输尿管结石能用体外碎石吗 输尿管体外碎石可进行几次 输尿管中段结石可以体外碎石吗 女人梦见大便是吉兆发财 客厅沙发后挂飞机起飞的画可以吗 发帖第一人为什么叫坐沙发 充气沙发可以带到飞机上吗 私人飞机沙发有安全带吗 隔夜菜、隔夜肉、隔夜水、隔夜茶,到底能不能吃?涨知识了 梦见男友和闺蜜谈恋爱 我五年前办了一个建设银行卡,后来没了现在还能再办吗 扫描时怎么把两个a5变成a4 a4等于两个a5 水晶洞的摆放家里什么位置 水晶摆件的摆放忌讳 GPRS通信费是什么意思 GPRS国内通信费是什么东西,半个月吃掉吾100多的话费,吾没怎么上过网啊... 什么是GPRS通信费? 为什么天气很冷,手机充电很慢啊? 睡前小故事 001 小海豚 广东省海洋工程职业技术学校的学校简介 广东海洋大学职业技术学院的学院简介 广东海洋大学职业技术学院 微信聊天记录迁移到另一台手机,怎么操作? 上海市浦东新区塘桥幼儿园好吗 1998年出生属虎人2022年运势 小米英文怎么写 万能角度尺按其游标读数值可分为几种 工作台优点有哪些? 购买一台厨房工作台大概多少钱、? 南通圆通快递转运中心工资怎么样 南通圆通转运中心到如皋多久 丫T快递单号查询4521028699359圆通 省专监机考分数怎么看 贵州省应急管理厅:杜绝“三超一疲劳”等交通违法行为,还有哪些信息?_百... 对威海发生18连环相撞交通事故一事,交警是怎样定则的? 中国监理协会化工监理分会工程师证怎样查询? 尼日利亚发生严重交通事故,致15人死亡,此次事故后续处理结果如何?_百度... 贵州监理协会专监z51160260 山东移动智汇云店小程序收集了我的手机号我该怎么办? 绑定云端手机号是显示手机号位置还是手机位置 云助理手机号改了,e店同步吗 存支票必须去开户行吗? 支票要到开户行? 他是孔子眼中的圣人,为何却做出兄弟相杀、君臣相忌之事?