- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
184 2009 10
基于可比语料库的双语术语抽取研究述评*
1 1, 2 1
1 ( 100038)
2 ( 2 10094 )
= 对基于平行语料库的双语术语抽取和基于可比语料库的双语术语抽取进行对比分析, 说明基于可比语料
库的双语术语抽取的研究意义与应用价 。分析总结解决该问题的主要方法及其优化方法, 指出存在的问题并
展望该研究的未来发展方向。
= 双语术语抽取 可比语料库 上下文向量 向量相似度计算
= TP391
Survey on B ilin gua l T erm in ology Extr action from C om parab le C orp or a
1 1, 2 1
K ang X ao l Zhang Chengzh W angH u l n
1 ( In st tu te of Sc en t f c T echn cal In form at on of Ch na, Be j ng 100038, Ch na)
2 (D epartmen t o f In format on M anagem en t, N anj ngUn vers ty of Sc en ce Techno logy, N anj ng 2 10094, Ch na)
=Ab str act By comp ar ng w th extract ng b l ngual term n ology from parallel corpora, th s paper descr bes th e value of ex2
tract ng b l ngual term no logy from comparab le corpora. It summ ar zes the m a n m ethod and th e opt m zat on m ethod s of
mp lemen tat on of b l ngual term nology extract on. And some p ersp ect ves and prospects abou t b l ngual term no logy ex2
tract on based on the comparab le corpus are p roposed.
=K eyw or d s B l ngual term nology extract on Comparab le corpora Con text vector V ector sm lar ty compu tat on
1
[1] [ 2] [ 3]
双语术语抽取可应用于双语术语词典编撰 、跨语言信息检索 、机器翻译 等广泛领域。由于国际化的需要,
越来越多的文件采用多种语言的形式在互联网上传播和交流, 多语语料库资源日益增多, 促进了双语术语抽取的研
究和应用。目前, 主要研究方向是在平行语料库上进行双语词语或双语术语的抽取。基于平行语料库的双语术语抽
取具有正确率高的特点, 但由于平行语料库不易获取, 有学者提出利用可比语料进行双语术语抽取的思路。
2
目前, 双语术语的抽取基本上是基于平行语料库进行的。平行语料库( Para llel Corpus) 由源语文本和从源语
[ 4]
文本翻译的译语文本构成 。平行语料可为双语也可以是多语, 还可以是双向等价翻译。例如, 可以由中文文本
及其翻译的英语文本组成, 也可以由中文文本及其翻译的英语、德语、法语、日语等的译语文本组成, 还可以由中
英文双向翻译文本组成。平行语料长期以来在机器翻译研究领域被广泛用于获取词对知识, 构建翻译词典, 以提
收稿日期:
您可能关注的文档
- 基于顾客价值消费者行为模式探析_魏巍.pdf
- 基于顾客导向网络品牌建设.pdf
- 加强古诗文教学中情感体验.pdf
- 鸡黄曲霉素中毒的诊疗和防制.pdf
- 基于Z值模型上市公司财务危机预警.pdf
- 加强反避税措施堵塞涉外税收流失黑洞.pdf
- 基于模块关键属性产品配置方法.pdf
- 基于分子靶点的非小细胞肺癌个体化治疗现状与未来.pdf
- 基于技术路线图视角下的中国新兴产业发展_挑战和破局.pdf
- 建立职业卫生中介服务机构信誉等级管理机制初探.pdf
- 核因子相关因子2和心血管疾病.pdf
- 基于顾客价值企业竞争优势分析_以郑州宇通客车股份有限公司为例.pdf
- 基于钻石模型的集群竞争优势的比较研究张江、新竹和筑波的案例.pdf
- 甲骨文_不_与_弗_语义指向方面的异同.pdf
- 建模教学在高中生物课堂教学中的实践和体会.pdf
- 吉西他滨联合顺铂3周方案治疗晚期非小细胞肺癌患者的临床受益分析--前瞻性观察性的研究.pdf
- 吉西他滨耐药的A549与NCIH460细胞中耐药相关基因的表达与RRMl37AC基因多态性.pdf
- 计算机与互联网使用状况调查报告.pdf
- 基于HNC与描述逻辑的问句语义块分析.pdf
- 甲氨蝶呤联合来氟米特对类风湿关节炎早发动脉粥样硬化预防价值_袁霞.pdf
文档评论(0)