- 2
- 0
- 约2.29万字
- 约 6页
- 2026-03-05 发布于福建
- 举报
朱泽炜等:基于LoRAPlus的DeepSeek大模型烹饪技法微调研究33
基于LoRAPlus的DeepSeek大模型烹饪技法微调研究
朱泽炜柯显信(通讯作者)罗纳多刘朋
(上海大学机电工程与自动化学院)
摘要:为解决中式烹饪技法因含大量隐形知识而导致DeepSeek-R1-Distill-Llama8B大模型应用效果欠佳的问题,本文
结合思维链推理技术,采用LoRA及其改进方法DoRA、rsLoRA和LoRAPlus四种高效微调技术,对国内开源推理大模型开展
烹饪技法微调研究。通过构建含显式思维链的cooking_tech烹饪技法数据集,微调出对应四个技术的模型,并从烹饪技法、基
准测试、微调效率三方面进行评估。结果表明,LoRAPlus模型表现最佳,不仅凸显了大模型在烹饪技法任务上的优秀潜力,
而且通过微调,得到了一种可应用于烹饪机器人的DeepSeek大模型版本。
关键词:LoRAPlus微调;大语言模型;人工智能;思维链推理;烹饪技法
DOI:10.15988/j.cnki.1004-6941.2025.10.007
LoRAPlus
原创力文档

文档评论(0)