- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
The 2015 Conference on Computational Linguistics and Speech Processing
ROCLING 2015, pp. 206-2 17
The Association for Computational Linguistics and Chinese Language Processing
. 代汉语语义词多义词词的校和修
摘要
本文依据面向汉语信息处理的词语义 区分的 完备性 和 操作性 原
则,基于 代汉语语义词 SKCC 和 代汉语语法信息词 GKB
的词 对 ,以语料 依托并结合 代汉语词 义词词林 和 代
汉语搭配词词 等词 资源进行 代汉语语义词 的多义词词 校 工作 首
先 SKCC 和 GKB 的词 对 入手 ,设 了候选拟修改多义词的 取算法 ,对
取出来的 1605 个多义词进行了义 补录 合并 删除,补充释义,修改翻译
和示例等工作, 时针对 类特殊的 食物+作物类 多义词建立了义 的树形
结构以满足 粒度的词义消歧任 要求 方便 续的修改工作 ,本文开发了
SKCC 和 GKB 之间的词 映射 ,在 的基础 进行了多义词映射工作
关键词 义 区分 代汉语语义词 多义词映射 多义词修改
New editing and checking work of the Semantic Knowledge base of
Contemporary Chinese (SKCC)
Abstract:
This paper is rooted in the two principles and methods that should be followed by
sense discrimination for Chinese language processing: Completeness and discreteness.
Built on the comparison of Semantic Knowledge-base of Contemporary Chinese
(SKCC) and Grammatical Knowledge base of Contemporary Chinese (GKB),
supported by large scale corpus, we conducted our new editing and checking works.
Firstly, we designed a novel multi-sense lexicon candidate abstraction algorithm
based on lexicon comparison between SKCC and GKB. For all 1605 candidate
multi-sense lexicon, we conducted editing work on the senses, explanation, and its
translation Then, we built a tree structure to process a special food and plant lexicon.
Thirdly, a mapping platform between SKCC and GKB has been built to help us built
mapping relationships between multi-sense lexical between SKCC and GK
文档评论(0)