- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从词网出发的中文复合名词的语意表达-associationfor
Computational Linguistics and Chinese Language Processing
Vol. 8 , No. 2 , August 2003, pp. 93-108 93
The Association for Computational Linguistics and Chinese Language Processing
從詞網出發的中文複合名詞的語意表達
*
柯淑津
摘要
WordNet 提供豐富的詞彙語意資訊,因此對於自然語言處理相關研究有很大的
幫助。但是由於Princeton WordNet 的語意資訊僅以英文的形式呈現,為了能
讓 WordNet 所蘊含的豐富資源也能應用到中文相關處理,我們試圖利用雙語
字典等多項已存在的資源做為橋樑,希望能將英文 WordNet 的豐富資源自動
引介到中文。但是,在我們觀察這些連結英文 WordNet 與雙語字典所產生的
初步結果後,發現由於語言之間的藩籬以及雙語字典的目標語詞彙大都偏向於
解釋等多種原因,使得英文同義詞集(Synset)所對應到的中文翻譯,常是一些
不具結構性的中文複合詞、片語、甚至是一長串的句子,而不是獨立的中文詞
彙。這樣的現象與中文詞網應以詞彙為基本元件的要求相違背。因此,本研究
將針對這種現象作進一步的處理。
本文的主要目標有下列兩項:首先,自中文複合詞找出最能代表其意義的中心
詞彙,及若干個特徵詞彙。其次,將這些詞彙進一步以語意概念形式表達出來。
第一個部分,我們透過語法結構分析來完成。至於,第二個部分,詞彙的語意
我們透過知網的概念特徵來表示。當然,在中文詞彙轉為詞義概念的部分,是
存在著歧義現象的。辨識語意歧義的方法,我們除了用到詞彙的詞性之外,還
透過 WordNet 的上位關係來降低歧義度。我們以名詞部分進行實驗,實驗結
果顯示在語意標示方面,可達到93.5%的應用率以及93.8%的正確率。
Abstract
WordNet provides plenty of lexical meaning; therefore, it is very helpful in natural
language processing research. Each lexical meaning in Princeton WordNet is
presented in English. In this work, we attempt to use a bilingual dictionary as the
backbone to automatically map English WordNet to a Chinese form. However,
we encounter many barriers between the two different languages when we observe
the preliminary result for the linkage between English WordNet and the bilingual
dictionary. This mapping causes the Chinese translation of the English synonym
*
東吳大學資訊科學系 E-mail: ksj@.tw
柯淑津
collecti
原创力文档


文档评论(0)