基于KSVM的中文实体关系抽取研究.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分类号 UDC 密 级 学 号 1108120671 硕士学位论文 基于 KSVM 的中文实体关系抽取研究 蒲 淼 学 科 门 类: 工 学 学 科 名 称: 计算机应用技术 指 导 教 师: 姚全珠 申 请 日 期: 2014 年 4 月 万方数据 西安 西安理工大学硕士学位论文 2 2 万方数据 摘要论 摘要 论文题目:基于 KSVM 的中文实体关系抽取研究 学科专业:计算机应用技术 研 究 生:蒲 淼 签 名: 指导教师:姚全珠 教授 签 名: 摘 要 信息抽取的主要目的是将非结构化的文本转换为结构化的信息,这既可以满足人们从 海量信息中得到有价值信息的需求,同时也是信息检索、自动问答系统等方面的基础技术。 实体关系抽取是信息抽取的重要环节,目前已经成为热门的研究课题且具有广阔的应用前 景。在近年的研究中,人们把实体之间的关系抽取转化为分类问题,构造相关的关系实例, 通过机器学习算法训练得到分类器,来判断候选关系属于哪一类预定义关系。 在机器学习算法中,SVM(Support Vector Machine)分类的精确度最高,KNN(K-Nearest Neighbor)居于其次。由于 SVM 所采用的核函数可以将非线性的分类转换为线性的分类问 题,而且具有隐含的高维分类特点,因此基于核函数的实体关系抽取方法成为目前应用最 为广泛的方法。针对采用 SVM 进行分类以及核函数本身在中文实体关系抽取中的不足, 本文的主要工作以及创新点如下: 1. 在基于 SVM 的中文实体关系抽取方法中,错分的样本点大多数都分布在特征空间 中最优分界面的附近,是因为采用 SVM 进行分类时只取一个代表点进行分类,本文针对 这一问题提出了一种基于 KSVM 的中文实体关系抽取的方法。该方法结合 SVM 和 KNN 算法各自的优势,对于在分界面附近的样本点使用 KNN 进行分类,因为使用 KNN 进行 分类时把每一个样本点都看做是代表点;对于离分界面较远的样本点使用 SVM 进行分类。 最后在中文语料库上进行了实验,验证了该方法具有更好的分类效果。 2. 采用基于树核函数方法进行关系抽取时,关系实例结构语法树所包含的信息越丰 富且冗余信息越少,则其抽取效果越好。为此,本文参照 Moschitti 提出的三种树型拓展 结构,提出了一种基于 PartialTree 核函数的中文实体关系抽取方法。该方法依然使用语法 结构树为处理对象,借鉴序列挖掘算法,挖掘出包含更为详细信息的结构化子树,再使用 本文设计的 PartialTree 核函数计算两个关系实例之间的相似度来进行分类。最后通过在中 文语料上的实验证明了该方法的有效性。 关键词:实体关系抽取;SVM;核函数;KNN;PartialTree I 万方数据 II Ab Abstract Title : RESEARCH ON CHINESE ENTITY RELATION EXTRACTION BASED ON KSVM Major:Computer Application Technology Name:Miao PU Signature: Supervisor:Prof.Quanzhu YAO Signature: Abstract The main purpose of Information Extraction is to transform unstructured text for structured information, it not only can satisfy people to get valuable information from huge amounts of information demand, is also the basis of the Information Retrieval and Automatic Response System. Entity Relation Extraction is an important links in the Information Extraction, has now become a hot research topic and has broad application prospects. In recent study, people regard Entity Relation Extraction as a classification problem, construct relevant relationship instance, and use machine learning algorithm to

文档评论(0)

yurixiang1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档