基于LoRA Plus的DeepSeek大模型烹饪技法微调研究.pdfVIP

基于LoRA Plus的DeepSeek大模型烹饪技法微调研究.pdf

朱泽炜等：基于ＬｏＲＡＰｌｕｓ的ＤｅｅｐＳｅｅｋ大模型烹饪技法微调研究３３

基于ＬｏＲＡＰｌｕｓ的ＤｅｅｐＳｅｅｋ大模型烹饪技法微调研究

朱泽炜柯显信（通讯作者）罗纳多刘朋

（上海大学机电工程与自动化学院）

摘要：为解决中式烹饪技法因含大量隐形知识而导致ＤｅｅｐＳｅｅｋ－Ｒ１－Ｄｉｓｔｉｌｌ－Ｌｌａｍａ８Ｂ大模型应用效果欠佳的问题，本文

结合思维链推理技术，采用ＬｏＲＡ及其改进方法ＤｏＲＡ、ｒｓＬｏＲＡ和ＬｏＲＡＰｌｕｓ四种高效微调技术，对国内开源推理大模型开展

烹饪技法微调研究。通过构建含显式思维链的ｃｏｏｋｉｎｇ＿ｔｅｃｈ烹饪技法数据集，微调出对应四个技术的模型，并从烹饪技法、基

准测试、微调效率三方面进行评估。结果表明，ＬｏＲＡＰｌｕｓ模型表现最佳，不仅凸显了大模型在烹饪技法任务上的优秀潜力，

而且通过微调，得到了一种可应用于烹饪机器人的ＤｅｅｐＳｅｅｋ大模型版本。

关键词：ＬｏＲＡＰｌｕｓ微调；大语言模型；人工智能；思维链推理；烹饪技法

ＤＯＩ：１０．１５９８８／ｊ．ｃｎｋｉ．１００４－６９４１．２０２５．１０．００７