- 6
- 0
- 约9.78万字
- 约 77页
- 2019-07-13 发布于广东
- 举报
摘要
摘要
在机器翻译和作文自动评分领域已经有比较成熟的研究成果,但是在人工
翻译评分领域的研究还不够深入。在同为主观题的作文评分中,采用多元线性
回归方法建立文本特征和分数之间的方程。但是人工翻译评分选取的文本特征
之间关系更为复杂,如果使用作文评分中的方法去构建模型,并不能取得最好
的效果。而神经网络作为一种自适应学习模型,在处理复杂变量之间关系时会
更有优势。在此背景下,本文尝试构建汉译英人工翻译评分模型,并在此基础
上构建大学生翻译评分系统。
本文首先从语言基础、语义、连贯性、测试点四大方向提取学生译文语料中
的翻译文本特征,并对其中一些提取算法进行设计与改进。一些重要的改进包
括:(1)将潜语义分析的方法与翻译评分结合,并提出了一个基于相似译文集
的潜语义相似度提取算法。(2)通过引入连接词权重,实现一种新的基于相似
译文集的带权连接词相似值提取算法,解决了单纯连接词个数与人工评分负相
关的不合理现象。其次,本文比较了神经网络和多元线性回归,并最终选择用
BP神经网络构建人工翻译评分模型。针对BP算法收敛慢,不利于全局寻优的
特点,进一步采用粒子群算法进行优化。最后,在特征提取和模型构建的基础
上,进一步搭建大学生翻译评分系统,能有效的给学生译文打分,并能进行一
定的反馈评价。
在特征提取方面,基于译文集的连接词算法使得该特征与人工评分正相关,
引入连接词权重之后进一步将相关度提高了1%:潜语义相似度提取算法效果比
较显著,单单考虑相似度区间为0.9.1的译文集,就将相关度提高了24%。在模
型构建上,本文分别使用多元线性回归与PSO.BP神经网络两种方法进行了测
试验证。结果表明,PSO.BP神经网络能提高6%的相关度,更适宜于翻译评分
模型构建。
关键词:汉译英,自动评分,特征提取,潜语义分析,BP神经网络,粒子群算法
万方数据
摘要
万方数据
ABSTRACT
ABSTRACT
Theresearchinthefieldofhumantranslationisnot
deepenough,eventhough
thereare maturereseachintheareaofmachinetranslation
relatively evaluation(MTE)
andtheautomated of
essayscoring.Theessayscoring,anothertypesubjectiveques-
linear methodtoestablishthe betweenthetext
tion,usedmultipleregression equation
featureandthescore.Buttherelationbetweenthetextfeatureinhuman ismore
scoring
webuildthemodelinthesameas not
way writingdoes,wemay
complicated.If essay
thebestresults.Theneural an
您可能关注的文档
- 智能天线射频电路的分析与设计.pdf
- 智能天线中信号处理算法的分析.pdf
- 智能型锂离子电池充电芯片XD0818的分析和设计.pdf
- 智能压力变送器的分析与设计.pdf
- 中等收入群体比重变动问题分析.pdf
- 中国非正规就业与城市化的关系分析.pdf
- 中国国债收益率曲线的构造.pdf
- 中国恒河猴脾虚证艾滋病动物模型先天免疫因子MBL和α-防御素的分析.pdf
- 中国健康人群与造血干细胞移植患者他克莫司的群体药动力学分析.pdf
- 中国经济区域划分——基于各省(自治区,直辖市)人均GDP曲线的划分.pdf
- 2025至2030中国水力发电设备行业发展分析及前景趋势与细分市场及应用领域与趋势展望研究报告.docx
- 2026年研学旅行商业模式创新与盈利分析报告.docx
- 2025年元宇宙彩妆安全配方市场潜力报告.docx
- 挑战拔高卷综合版临床医学检验中级职称之临床检验基础考点串联.docx
- 2026年潮汐能发电十年发展趋势:机组模块化与海洋能源未来报告.docx
- 超声波医学技术中级职称专业知识及专业实践能力模拟考核深化提高卷.docx
- 2025年医药冷链安全风险五年评估报告.docx
- 2025年四川省宜宾市高职单招职业适应性测试考试题库及答案解析.docx
- 2026年社保服务数字化十年成效报告.docx
- 2025年金属加工行业人力资源十年发展报告.docx
原创力文档

文档评论(0)