hinge-loss和log-loss训练是什么
发布网友
发布时间:2022-04-27 03:05
我来回答
共1个回答
热心网友
时间:2022-06-25 05:38
是损失函数,在统计学,统计决策理论和经济学中,损失函数是指一种将一个事件(在一个样本空间中的一个元素)映射到一个表达与其事件相关的经济成本或机会成本的实数上的一种函数。
损失函数是描述系统在不同参数(parameter)值之下的损失。要应用损失的函数,其损失必须是通过某种媒介可以衡量的。
损失函数在实践中最重要的运用,在于协助我们通过过程的改善而持续减少目标值的变异,并非仅仅追求符合逻辑。
现在举个例子:某个工厂人员的产出,以每小时多少元来计算,而损失函数所显示的,是产出以室内通风条件而改变的情形。厂内工作的每个人,都有自己的损失函数。为了简化说明,假设每个人的损失函数均为一条抛物线,其底部一点代表产出值最大时的通风条件,把所有人员的损失函数进行叠加,公司整体的损失函数也必然是一条抛物线。如果通风条件偏离这个最佳水准,就会有额外损失发生。
该抛物线与横轴相切时,切点的左右各有一小段与横轴几近重合。也就是说,有最适点偏离一小短距离,损失小到可以忽略不计。因此,当室内通风条件稍稍偏离均衡点,发生的损失可以忽略不计。
但是远离均衡点时,总是有人必须支付这损失。
如果我们能够导出有具体数字的损失函数,我们就可以计算出最有均衡点,在均衡点中最适合的通风条件如何,以及达到要求的费用支出是多少。
损失函数并非一定是对称的。有时候其中一边很陡峭,有时候则两边都很陡峭。举例而言,为了使钢片较容易焊接,需要加入钶。但钶的加入量如果低于必须量,纯粹是浪费,对焊接一点益处都没有。然而钶用量如高于十万分之一,也是一种浪费,所增加的利益相当有限。
戴明博士曾在《企业研究的样本设计》(Sample Design in Business Research)一书内,列示了一个实际的损失函数。它显示我们只需要尽量靠近样本的最优组合就行了,只要非常接近就可以了。
以赶火车作为符合规格的例子。假设我们的时间价值为每分钟n元,下图左边的斜线是损失线的斜率;早一分钟到达月台,将让我们损失n元,早两分钟到达损失2n元。另一方面,如果没有赶上火车,我们的损失是M元。迟到半分钟或迟到5分钟损失一样,损失函数直接由零跳到M。
当然问题也可复杂化,例如火车每天离站的时间也有变化,所以也可以画出一个分配图。火车到站时间三个标准差的界限可能是8秒。把问题这样复杂化,对于我们了解和应用损失函数并没有特别大的帮助,因此我们就说到这里。 另一个例子,是参加星期日早上11点15分的礼拜时所碰到的停车问题。教堂的停车场最大负荷是停放50辆车子,但这些车位在10点50分左右仍然客满,因为作完上一场礼拜的车主仍在喝咖啡。等他们一离开,这些空位马上就会被排成长龙等待的车队填满。如果你想占到一个车位,不得不早早去排队。那些晚到的人在这里找不到车位,只能到街上去找,但实际上往往无功而返。所以,上策还是提早一点去等,承受等待的损失而能占到位置。
这项理论也可以应用到任何计划的截止时间上。某人要求必须在截止日期前完成工作,万一未能赶上这个时间,势将使计划延误或出错。为了能准时完成,可以拟定工作内容与步骤的纲要。把个步骤的截止日期 设 定一段期间要比设定为固定的从容,而且有时间作最后的修订,可能把计划做得更好。
我们在这里再次提及一些老生常谈,就是千万不要以符合规格为自满。那么我们的产出水准在最低损失的位置吗?假设损失函数为
L(x)=ax (抛物线)
则x为0时,损失为最小。至于生产的损失函数是:
∫-∞L(x)P(x)=f(u,б)
显然u为零时损失最小,因此我们努力的目标,应该把生产移向目标值,即u为零。
以上所叙述的并不是什么新理论。此外,多年前贝提(John Betti)在福特汽车公司所说的一段话也值得引述:“我们美国人关心的是符合规格;相反地,日本人则齐心一致,尽力减少与目标值的变异。”
由此可知,某项产出的散布(dispersion)情况,并不能作为成就的指标。事实上,中心线的位置才是最重要的,我们当然应该努力使任何生产的散布尽可能缩小,但是那只是第一步。下一个重要的步骤是使中心位置在目标值上。
这些简单的说明,可促使我们了解,如Cpk这种测度散布情况的测度毫无价值,因为它们对评估损失来说毫无意义可言。此外,只要放宽规格,就可以使该值低至任何数值。
无论是符合规格、零缺陷或其他秘方,都没有找到问题的关键所在。