中文问句与RDF三元组映射方法研究.docVIP

中文问句与RDF三元组映射方法研究.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文问句与RDF三元组映射方法研究.doc

中文问句与RDF三元组映射方法研究* 许德山1,2 张智雄1 赵妍3 (1中国科学院国家科学图书馆,北京 100190) (2中国科学院研究生院,北京 100049) (3郑州航空工业管理学院计算机科学与应用系,郑州 450015) [摘要]主要探索中文问句与RDF三元组的转换方法。文章首先对中文问句的特点进行了分析,然后结合RDF(S)模型的优势,探索了RDF三元组与问句语义的对应关系,进而提出了直接映射和间接映射两种映射方式。该方法只需做浅层的句法分析,将获取的限定成分映射为三元组内部的语义标签,从而降低了句法分析和三元组组配的难度。最后分析了映射方法中存在的问题并提出未来工作的重点。 [关键词] 问题分类; RDF模型映射; 三元组映射 [分类号] TP391 A Research on Chinese Interrogative Sentences and RDF Triples Mapping Methods Deshan Xu1,2 Zhixiong Zhang1 Yan Zhao3 (1 The National Science Library, Chinese Academy of Sciences, Beijing 100190) (2 Graduate University of Chinese Academy of Sciences, Beijing 100049) (3 Department of computer Science and Application, Zhenzhou College of Aeronautical Industry Management, Zhengzhou 450015) [Abstract] This paper introduces two mapping methods between Chinese interrogative sentences and RDF triples. We firstly analyze the characteristics of the Chinese questions and discuss the relationship between the RDF triples and the questions according to the advantages of RDF (S) model. Furthermore, we proposed two mapping methods-direct and indirect. Only shallow parsing needs to be done during processing, and then the restrictive chunks are mapped into semantic labels inside triple, so the methods make the syntactic parsing and the triples assembling easer. Finally, we analyze the open issue in the methods and show our expectation in the future. [Keyword] Question Classification; RDF Model Mapping; Triple Mapping 引言 国际联盟(W3C)语义检索标询语SPARQL,用来对检索。SPARQL的使用并不简单,需要了解本体知识库的组织学会SPARQL的语来达询图为户带来了为户然语来达询图统动结1中文问句的特征分析 本文的研究主要针对由关键(主、谓宾)和修饰(定、状补)构成的标准问句进行分析,这类问句结构完整,意思表达明确,容易进行形式化处理。具体来看主要存在下列特征。 ①句子短小,主旨明确。通常根据问问点将为问选择问指问[1]。其中特指问实际义指问点对问对进行发问获对关的点时间数实关的实举、义等问题 ②具有特定的疑问词问词对问内类围何处”询问点或谁个询问个问词强词过词结合问语内问语义检索统个环节:问分词词标问题的类问题的焦点类检实验问题[2],使用ICTCLAS[3]对训练集合中的5000条问 图1 特定词性的词频统计分析 从上面的统计中可以看出,中文问句中频次最高的是名词(n)、代词(r)、动词(v)、形容词(a),所以对问句关键词的提取主要是以上述词性的词汇为主。句子中做主语宾语为词词谓语为动词词为词词这对应关关键词较词汇结进组达问义1问句成分的划分 问句成份 说明 问题类question 主要根据疑问词和词频统计获取问题的分类 疑问对topic 问问对语宾

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档