问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

ERNIE - 清华 详解

发布网友 发布时间:2024-09-15 03:09

我来回答

1个回答

热心网友 时间:2024-12-13 15:53

ERNIE,即Enhanced Language Representation with Informative Entities,是研究者们通过增强BERT模型,将显性知识融入其中,以提升模型在知识驱动任务中的表现。尽管百度的ERNIE模型也具有影响力,但其知识的注入方式为隐性。清华大学的研究着重于通过模型结构的调整,融合知识和语言语义,清华ERNIE与华为ZEN模型在结构上有所相似,但目前效果上不如ZEN,后者通过N-gram而非实体融合,且融合策略不同。

关键问题在于如何从文本中提取知识,并与BERT的上下文语义嵌入相结合。模型的核心包括T-Encoder和K-Encoder:T-Encoder负责文本的词法和语义编码,有N层;K-Encoder则处理知识实体嵌入及融合,有M层。输入文本以subword级别处理,实体嵌入使用transE模型,通过(H,R,T)构建关系和实体向量。然而,早期的transE模型仅适用于一对一关系,不适用于多对多或一对多的关系。

ERNIE模型的主要作用在于,通过multi-head self-attentions(MH-ATTs)结合token和entity嵌入,进行信息融合,使用非简单的加法,而是combine和divide过程。预训练阶段通过denoising entity auto-encoder(dEA)增强模型,训练时要求模型根据mask的token预测对应的entities。而在特定任务的fine-tuning阶段,分类任务依赖于[CLS]输出,而知识驱动任务则要求更高的NER准确度和适度的模型简化。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
南南京到许昌的公共汽车票 南京去句容需要多久 南京到单县汽车票多少钱 八月十一号南京到高密的汽车票提前几天买 外省保育员证在广东能领到补贴吗 外省的保育员资格证可以在深圳申请补贴吗 广州保育员证在深圳可以申请从教津贴吗 广州的保育师证能在深圳用吗 很走心的干净短句,具有治愈能力的句子 社会很现实的哲理句子太经典了 半人马怎么造句 驾照第一次换证逾期了怎么办? 组合盘谁in谁,组合盘怎么看谁对谁 人的本质在现实性上指的是 有哪些适合高中生投稿的杂志?写的是一些生活上的情感文,作文杂志什么的... 经济生活文摘投稿须知 几月份花生成熟阳历 花生什么时候成熟 黥面古代刑罚 域名被别人注册,whois查询不到对方联系信息,怎么买对方域名 加拿大移民条件2022 加拿大移民需要多少钱2022-签证资讯 2022~2023门槛最低的加拿大移民新捷径-境内LMIA工签+经验类省提名(加拿 ... 全自动远红外治疗仪的工作原理是什么? 右腿突然失去知觉摔倒之前没有麻木疼痛 大腿外侧麻木没有知觉怎么回事 腿麻木无知觉的原因 学校会计做什么 学校做会计有什么发展 学校会计属于什么岗位 学校会计是做什么的 学校的会计叫什么 求一篇商务感谢信 感谢对方带自己参观以及与一些客户见面 让自己学到了... 买二手房为什么要晚上去看 怎么才能成为一个很招女生喜欢的女生? 带皮花生煮多长时间熟 cometrue是什么意思啊? cometrue是什么意思 2024年公认性价比高的儿童手表有哪些? 李道林的学术成果主要集中在哪些方面? 定远县九梓乡九子中学04届朱冬冬求同班! 合肥到定远九梓乡要修地铁吗 丈夫出轨,离婚时妻子能否索要精神损失费 大学城周围有哪些学校 广州市黄埔区深井小学学校概况 白沟川骄自助火锅能不能用学生证 白沟川骄火锅招聘吗? 刚买的手机看电视剧不到一集就发烫有问题没有? 志不求易者成事不避难者进的意思 志不求易事不避难臣之职也的背景是什 ... 照片格式怎么转换pdf格式 顺丰快递刚才8点到无锡硕放集散中心什么时候能到无锡南洋技术学院,大神... ...我的额快递到了无锡分拨中心一直都不动啦。急啊