问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

概率与统计——条件概率、全概率、贝叶斯、似然函数、极大似然估计

发布网友 发布时间:2022-10-29 08:07

我来回答

1个回答

热心网友 时间:2023-10-09 21:32

事物A独立发生的概率为 ,事物B独立发生的概率为 ,那么有:

表示事物B发生之后事物A发生的概率;

表示事物A发生之后事物B发生的概率;

我们可以将公式写成全量的形式:

表示全量相互排斥且性质关联的事物,即:



那么可以得到

,这就是全概率公式。

全概率公式的意义在于:无法知道一个事物独立发生的概率,但是我们可以将其在各种条件下发生的概率进行累加获得。

例1,已知某种疾病的发病率是0.001,即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病,它的准确率是0.99,即在患者确实得病的情况下,它有99%的可能呈现阳性。它的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。一个人检测为阳性的概率是多少。

例2,袋子中50个球,20个黄球,30个白球。2个人一次从袋中各获取一个球,且不放回,求第二个人取得黄球的概率。

从另外一个角度说,无论前面的人抽了多少次,后面的人抽签总体概率是不变的。

例3,5张卡片上分别标记了1,2,3,4,5,每次取2张,连续取2次,取出后不放回。求第二次取出的卡片,比第一次取出的卡片大的概率。

例4,甲袋有5只白球、7个红球,乙袋有4只白球、2只红球。任意取一个袋子,求从袋子取得白球的概率。

贝叶斯公式的理解 :

可以理解他是全概率公式的反向应用,他是求某个条件出现时某个事件发生的概率。定义如下:

沿用前面医学的例子:

例1,已知某种疾病的发病率是0.001,即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病,它的准确率是0.99,即在患者确实得病的情况下,它有99%的可能呈现阳性。它的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。一个人检测为阳性时候,他确切患病的几率是多少。

从结论看,这个试剂挺不可靠的。

将贝叶斯公式的底部展开为全概率公式:

使用全概率公式展开之后有个很直观的发现: 当我们考察某一个事件的条件概率时——事件 发生之后 发生的概率,需要将整个样本空间中其他概率事件也加入到其中来。

似然函数个人理解是一种更加“公式化”的条件概率表达式,因为他书写的形式和条件概率相比并没有太大区别—— ,只是解读方式不同。这里的 表示样本特征数据, 表示模型参数。

如果 已知并且固定,那么表示这个是一个概率计算模型,表示:不同的样本 在固定的模型参数 的概率值。

如果 已经并且固定,表示这是一个似然计算模型(统计模型),表示不同的样本用于求解模型参数 。

按照前面似然函数 的介绍,似然函数可以看做 是已知的, 是未知的,极大似然估计就是在已知 的情况下求取 。

在现实的生产生活中也常常会遇到这样的问题。我们以及有了 样本 以及对应的 标签(结论) ,如何根据这些样本来计算(推算)条件 是一件很困难的事情。而极大似然估计就是一个根据样本值 和结论数据 计算条件参数 的过程。

总的来说,极大似然估计是一种 参数估计算法 。使用极大似然估计有一个很重要的先决条件——每 一组样本都是独立的,并且有充分的训练样本 。

先看看样本独立的判断公式: ,即2个事物同时发生的概率等于事物独立发生概率的乘积。

极大似然评估的公式及像这个公式。

设有一组样本 ,所有样本的联合概率密度 称为相对于样本 的似然函数。那么由独立判定公式推断出所有样本的概率为:

     。

设 是使得 取得最大值的 值,那么 是 的极大似然估计量。可以使用下面的公式表示 与 的关系:

,

实际计算时,计算连乘比较麻烦,我们可以引入对数将其转换为一个求和的过程:

,因为 。 也称为对数似然函数。

如果 连续可微,那么可以使用导数为0求函数的凸点。即:



将条件因子扩展为M个,即 ,则似然函数(对数似然函数变成):

此时每一个 的求导变成一个求偏导数的过程:

,每一个 都要对 求导。

最大似然评估(也称为极大似然评估)的用处是什么?首先可以将每个字眼拆解开来看。 最大 就是要找最大值 ,似然 说明并不精确似乎就是这个值 ,评估 指的是这是一个过程。

现实生活中的例子:2对夫妇 和 和一个小孩 。从外观上看,小孩 长相比较接近夫妇 ,有点像 ,不像 ,让你猜测 是谁的小孩。思维正常一点的人肯定会说 是 的小孩,这本身就是一个自然而然的判断过程,用数学解释:

使用似然评估,就可以断定小孩更像谁:



最大似然估计更多的应用是在有一定样本数据的情况下用于模型评估,更准确的说是模型中的参数评估。因为似然评估来自于概率独立判决公式—— ,所以要求用于评估的样本数据相互独立。

先说一个很直观的案例解释这个问题:

例1,从盒子里连续取球,已知取得红球的概率 ,求当P取何值时最有可能连续三次拿到红球。

只管上来说,肯定是概率越高取得红球的几率越高,所以不做推断也知道 时拿到红球的几率更高。下面通过数学过程来说明这个问题。

设条件 ,表示取得红球, 表示没取得红球,所以用最大似然评估来计算参数得:

,只管的看就知道取值0.5似然评估最大。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
热喷涂是怎么样加热喷涂材料? 大额存款有什么优惠 过年银行存钱什么优惠 银行大额存款有什么优惠 到银行存钱有什么送 冰柜加了制冷剂不制冷的原因 冰柜用多久需加制冷剂 冰柜何时需加制冷剂 冰柜多久需要加制冷剂 冰柜何时需要添加制冷剂 摩托驾照d和e区别 vivox3的超长截图是什么软件 请问有没有天天看漫画app老版本?求 有什么漫画app看 豆角怎么画简单又好看 豆贴画制作方法简单 奔驰cls级是什么级别? 十个月宝宝能喝鸡汤吗 怎样查看群聊 贾乃亮晒日常随拍,戴休闲遮阳帽日落余晖,他如今的生活节奏怎么样? 贾乃亮晒与甜馨10岁生日合照,离婚后许久不见女儿的他晒娃是为蹭热度吗? 我想了解有关贾乃亮的一些资料(最好有照片) 体检后通知复检会不会是因为不合格? 如果去天津港买兰德酷路泽中东版,哪家靠谱些 兰德酷路泽与中东版有什么区别全国哪有现车 中国哪有兰德酷路泽进口的经销商 兰德酷路泽买不到了吗 酷路泽停产了为什么还有22款 西安哪里能买到2010款中东款兰德酷路泽4700顶配 为什么apple tv投视会卡? 酷路泽在哪里 我的宽带是电信20M光纤,路由是网件wndr3400,双频600M。在家用apple tv;手机 pad看视频很卡。请问为什么 月度个人自我评价五篇 衣服上的鱼涎液么样洗 我叫MT2VIP12等级特权介绍 V12等级特权多少钱 win732位系统支持多少内存 win732位最大支持多大内存 姜子牙最后做了什么神 王者荣耀游戏时间 派出所能通过手机号查到你的个人信息吗? 宁波江北洪塘哪里可以办公交卡 宁波洪塘哪里能充值公交车卡 保养卵巢吃什么最好 保养卵巢好的食物推荐 养鸡子厂鸡子能吃冰淇淋吗? 吃田七,海马煲鸡可以吃冰淇淋吗? 香菇炖鸡汤跟冰淇淋可以一起吃吗 苹果手机一个手机登录两个,怎么操作? 2021揽胜行政怎么播放音乐 八月瓜几月份成熟 八月瓜什么时候成熟 八月瓜什么时候成熟? 楼上装修楼下天花板开裂,应该怎么样去处理? 枝辞蔓语成语解释