Kimi K1.5 技术手册说明书.pdf

KIMIK1.5:使用LLMS扩展

强化学习

KIMIK1.5技术报告

Kimi团队

摘要

语言模型的预训练通过下一个标记预测已被证明在计算扩展方面有效,但受限于可用训练数

据的数量。扩展强化学习(RL)为人工智能的持续改进

文档评论(0)

1亿VIP精品文档

相关文档