问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

【LLM】大语言模型学习笔记-4(Lora学习笔记理论篇2)

发布网友 发布时间:2024-10-06 08:31

我来回答

1个回答

热心网友 时间:2024-11-20 08:35

LORA是一种优化方法,用于在预训练模型的基础上适应新任务。在LORA中,冻结预训练模型的参数,同时注入可以训练的秩分解矩阵,实际上就是用BA的矩阵*近变化△w。具体实现代码如下:

代码首先定义了输入维度`input_dim`和输出维度`output_dim`,通常对应于预训练模型的隐藏层大小和层的输出大小。接着创建了两个可训练的张量参数`W_A`和`W_B`,分别用于表示LoRA权重A和权重B,形状分别为`input_dim x rank`和`rank x output_dim`。`rank`是一个超参数,表示对权重进行分解时的低秩维度,用于在模型复杂性、适应能力和欠拟合或过拟合风险之间进行权衡。

在LORA的实现中,`W_A`使用`nn.init.kaiming_uniform_`初始化,这是一种初始化方法,旨在确保良好的权重初始化,有助于训练的稳定性;`W_B`初始化为全零。接着定义了两个函数`regular_forward_matmul`和`lora_forward_matmul`,分别用于执行常规的矩阵乘法和LORA的矩阵乘法。在`lora_forward_matmul`函数中,先执行常规的矩阵乘法,然后添加了LoRA适应的部分,这部分计算是将`x`与缩放后的LoRA权重`W_A @ W_B`相乘,并用缩放因子`alpha`进行调整。

综合起来,这段代码展示了如何在适应新任务时使用低秩适应方法来修改预训练模型的权重,以便更好地适应新任务的特征。这可以帮助提高模型在新任务上的性能和收敛速度。

在进行LORA操作时,会注意到Q中的参数从4096*12288变为4096*16和16*12288。这种变化是通过取出原始模型的各个层的参数并进行冻结来实现的。在模型训练过程中,通过冻结参数来提高训练的稳定性和效果。

接着,设置Lora参数,使用PEFT库创建和配置PEFT模型。PEFT是对Transformer模型的一种改进,使用了低秩近似来提高模型的效率和可扩展性。创建`LoraConfig`实例并配置模型参数,如低秩近似、输出缩放、dropout等。设置任务类型为"CAUSAL_LM",即因果语言模型。然后将Lora参数注入到原始模型中,使用`get_peft_model`函数创建PEFT模型,并将其赋值给变量`model`。

最后,将数据模型放在`Trainer`中进行训练。创建`Trainer`实例,传入训练数据集、配置的训练参数(如批大小、梯度累积步数、学习率等)、数据收集器(用于处理数据批次),然后调用`trainer.train()`启动模型训练。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
玉米仁子饭产自哪里 中国期货交易所的交易品种有哪些? 历史要怎么读,有啥诀窍 高中历史诀窍 年终会活动策划方案 深度解析:第一财经回放,探索财经新风向 逆水寒手游庄园怎么邀请好友同住 逆水寒手游 逆水寒不同区可以一起组队吗? 逆水寒手游 逆水寒怎么进入好友世界? 逆水寒手游 逆水寒怎么去别人的庄园? 福建特产有哪些好吃能带走的 ...可以吗?会不会有什么不好?另外,耳朵经常有黄色的液体流出是怎么回事... 为什么带银质耳环,耳环上也会黏黏的,沾有黄色的东西。。。那是什么? ...可只要一戴上合金的耳坠就发痒,好像还有黄色的晶体,不知道是不是... 最叼的大学简称都是啥样的呀? 股票什么是中性盘 请问有谁知道玻璃滤锅具体是怎么过滤吗,需要加滤纸使用吗? ...推荐级别是什么顺序?比如买入,推荐,强烈推荐,中性等. 突发,P站或将永久关停! 大学生翻墙逛P站被抓,获刑1年6个月 开江大闸蟹专卖店地址 开江大闸蟹什么时候买最划算? 开江大闸蟹品质如何? 有没有像《三傻大闹宝莱坞》《爱情你我他》(美女别掉进我的魔掌)之类... 粉刺涂什么药 白蒲茶干追溯历史 去如皋水绘园景区旅行有哪些推荐购买的伴手礼? ...大头周长36厘米长2.6米的圆木,应该怎么算出重量? 圆木4米×∅20厘米多少元一根? 直径0.17m长4.5m落叶松圆木能承受多重屋面 如何在StableDiffusionWebUI 中使用Civital网站的LoRA模型?_百度... 请帮我看一下这款望远镜的价值,一个武警朋友送的,说值1000左右,特来确... 这是什么型号的望远镜? 我是新手,哪款的天文望远镜好,能看到太空上的星球越远越好,不过要清晰... 福州有什么味道独特的特产零食? 福建有哪些当地特色街头小吃? 福建有哪些当地特色美食值得品尝? 墙壁变黑如何处理 ...谁能给我起一个群名 群签名 群公告 群名片! 回南天墙壁黑了怎么清洁 墙壁黑了该怎么变白 联想ThinkPad X230i(2306A74)基本参数 电脑显示屏在主机没开的情况下自动开关是怎么回事? 如何将CAD文件导入EXCEL进行编辑? 土掌房自然村自然资源 土掌房自然村村情概况 大槟榔园村基础设施 酒房村基础设施 在白沙水自然村徒步游玩,是种怎样的体验? 加速折旧什么意思