利用 SFT 和 DPO 改进 LLM 的安全性和有 用性:关于 OPT-350M 的研究.pdf

利用 SFT 和 DPO 改进 LLM 的安全性和有 用性:关于 OPT-350M 的研究.pdf

利用SFT和DPO改进LLM的安全性和有

用性:关于OPT-350M的研究

PiyushPant

本SaarlandUniversity,Germany

译pipa00001@stud.uni-saarland.de

1

v

文档评论(0)

1亿VIP精品文档

相关文档