- 3
- 0
- 约1.21万字
- 约 13页
- 2016-11-27 发布于重庆
- 举报
基于《知網》的词汇语义相似度计算
基于《知网》的词汇语义相似度计算
刘群?? 李素建?
{liuqun,lisujian}@
? 中国科学院计算技术研究所
? 北京大学计算语言学研究所
摘要:
《知网》是一部比较详尽的语义知识词典。在基于实例的机器翻译中,词语相似度计算是一个重要的环节。不过,由于《知网》中对于一个词的语义采用的是一种多维的知识表示形式,这给词语相似度的计算带来了麻烦。这一点与WordNet和《同义词词林》不同。在WordNet和《同义词词林》中,所有同类的语义项(WordNet的synset或《同义词词林》的词群)构成一个树状结构,要计算语义项之间的距离,只要计算树状结构中相应结点的距离即可。而在《知网》中词语相似度的计算存在以下问题:
每一个词的语义描述由多个义原组成,例如“暗箱”一词的语义描述为:part|部件,%tool|用具,body|身,“写信”一词的语义描述为:#TakePicture|拍摄write|写,ContentProduct=letter|信件;
词语的语义描述中各个义原并不是平等的,它们之间有着复杂的关系,通过一种专门的知识描述语言来表示。
我们的工作主要包括:
研究《知网》中知识描述语言的语法,了解其描述一个词义所用的多个义原之间的关系,区分其在词语相似度计算中所起的作用;
提出利用《知网》进行词语相似度计算的算法;
通过实验验证该算法的有效性,并与其他算法进行比较。
您可能关注的文档
最近下载
- 机车轮对湿法磁粉探伤作业指导书.pdf VIP
- Unit 1 Teenage Life Reading and Thinking 说课稿-2024-2025学年高一英语人教版(2019)必修第一册.docx VIP
- 镗床的培训课件.ppt VIP
- 2025年12月英语四级真题(全三套)及答案解析.pdf VIP
- 黄绿蜜环菌化学成分剖析及染料木素药效的前沿探索.docx VIP
- 建筑材料燃烧热值检验原始记录表格.docx VIP
- 钢筋笼工厂化施工工法.ppt VIP
- 广东省高考:2025年-2023年《物理》考试真题与参考答案 .pdf
- 24J331 地沟及盖板资料.pdf VIP
- 新21XJ004 住宅排气道系统.docx VIP
原创力文档

文档评论(0)