- 0
- 0
- 约8.68千字
- 约 9页
- 2017-10-16 发布于天津
- 举报
基于不同分词框架的学术论文翻译系统-厦门大学学报自然科学版
基于不同分词框架的学术论文翻译系统
官新均1 陈珂2 苏旋3 邹权1,4
(1 厦门大学信息科学与技术学院, 福建厦门, 361000 ; 2 广东石油化工学院计算机科学与技术系, 广东茂名 , 525000 ; 3 仟首网络科技有限公司, 上海 , 200000 ; 4 厦门大学深圳研究院, 广东深圳, 518000)
摘 要 针对国内学者和研究人员在撰写英语论文时出现一些术语对应翻译不正确的情况,本文设计实现了基于术语词库框架的学术论文例句检索系统。由于该检索系统的查询关键字多为专业术语,如新词或未登录词,很难被普通分词方法有效分词,本文对此提出了一种自建专业术语词典树的方法,有效的提高了分词的准确率,返回更为精准的检索结果。
关键词:信息检索;机器翻译;分词框架
中法图分类号: TP391 文献标识码: A
随着国内外学术交流的日趋频繁,国内学者和研究人员往往需要撰写英语论文,由于母语的不同,常常遇到某些专业术语翻译的障碍,为了保证学术论文的严谨性,需要查阅大量的资料和论文,这就为学术论文例句检索系统的出现产生了契机。
而在相关例句的检索中,需要对文本信息进行切分。对于英文文本,单词用空格隔开,可以直接依据空格切分单词。不同于英文文本,中文文本是以连续的字符串的形式出现的,中间没有任何明显的分隔标志,需要对中文文本进行分词处理。
国内自80年代后期,陆续提出了
您可能关注的文档
- 基于控制流图支配树的测试数据灰度编码生成-计算机应用研究.pdf
- 基于空间相关性的大规模mimo信道压×反ù算法-重庆邮电大学学报.pdf
- 基于客户行为的4s店客户细分及其变化挖掘.pdf
- 基于可靠度和性能的结构整体地震易损性分析-自然灾害学报.pdf
- 基于建筑密度系数的二维城洪水数值模拟-长江科学院.pdf
- 基于间歇反馈多维泰勒网的动力学模型.pdf
- 基于加权最小二乘法的供水管网节点流量校核-重庆大学学报.pdf
- 基于回溯与引导的关键代码区域覆盖的二进制程序-电子与信息学报.pdf
- 基于环境和经济因素的xx模型的我国主要城的-中国统计教育学会.pdf
- 基于化学反应动力学机理的中等尺寸甲烷湍流扩散火焰的数值模拟.pdf
- 2026住宅小区消防改造建筑方案(执行版,含总平面布置/疏散流线/消防节点).docx
- 2026制造工厂人力资源规划与排班配置方案(执行版,含排班模型/岗位编制/缺口清单).docx
- 2026人工智能企业内训实施计划(执行版,含培训安排/案例任务/考核清单).docx
- 2026仓储物流园总平面布置建筑方案(执行版,含车流组织/仓位分区/消防间距).docx
- 2026老旧办公楼节能改造建筑方案(执行版,含围护结构/节能设备/施工节点).docx
- 2026Python文件批量重命名与归档脚本方案(执行版,含文件样例/处理脚本/归档规则).docx
- 2026企业会计准则长期股权投资核算指南(执行版,含成本法分录/权益法分录/减值检查表).docx
- 2026社区养老服务中心项目可行性研究报告(执行版,含服务需求/建设内容/运营预算).docx
- 2026物流园冷链仓储项目可行性研究报告(执行版,含选址分析/设备配置/财务测算).docx
- 2026企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板/勾稽检查表).docx
最近下载
- 格力IH电磁加热电饭煲【GDCF-4015C】技术服务手册.pdf
- 年产1.2亿粒复方降脂胶囊剂GMP车间设计.doc VIP
- 宝马摩托车说明书中文 F 900 GS - 0K61 EUR F_0K61_RM_0725_13.pdf VIP
- 年产一亿颗盐酸多奈哌齐胶囊的生产车间设计.doc VIP
- 文言语法知识全文.doc
- 文言语法知识全文.doc VIP
- 量子传感(Ⅱ):关键技术与典型代表.pdf VIP
- 石城县志(卷之1-9)蒋廷桂 主修,光绪18[1892]-7.pdf VIP
- 2025年四川教师招聘考试(数学专业知识)历年参考题库含答案详解.docx VIP
- 打屁股作文共九篇.doc VIP
原创力文档

文档评论(0)