- 12
- 0
- 约1.45万字
- 约 10页
- 2017-05-09 发布于天津
- 举报
基于集成学习的最小错误率训练算法陈王志豪赵程绮李江梦厦门大学软件学院福建厦门厦门大学自动化系福建厦门摘要最小错误率训练是统计机器翻译的标准调参方法在统计机器翻译建模过程中发挥着重要作用然而该方法在训练过程中容易出现训练过拟合现象即开发集训练得到的权重无法很好地适用于翻译测试集针对该问题本文引入集成学习方法来优化调参具体而言在调参时本文挑选不同的特征子集来训练多组特征权重并计算权重之间的空间距离以删除不合理的特征权重最后根据各组子集在开发集上的值来进行加权平均获得最终的特征权重和实验结果表明本文方
基于集成学习的最小错误率训练算法
陈昉 ,王志豪2,赵程绮1,李江梦1
(1 厦门大学 软件学院,福建 厦门 361005
2 厦门大学 自动化系,福建 厦门 361005)
摘要:最小错误率训练是统计机器翻译的标准调参方法,在统计机器翻译建模过程中发挥着重要作用。然而,该方法在训练过程中容易出现训练过拟合现象,即开发集训练得到的权重无法很好地适用于翻译测试集。针对该问题,本文引入集成学习方法来优化调参。具体而言,在调参时本文挑选不同的特征子集来训练多组特征权重,并计算权重之间的空间距离以删除不合理的特征权重,最后根据各组子集在开发集上的BLEU值来进行加权平均,获得最终的特征权重。
原创力文档

文档评论(0)