- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分类号
UDC
密
级
学
号
1108120671
硕士学位论文
基于 KSVM 的中文实体关系抽取研究
蒲 淼
学 科 门 类: 工 学
学 科 名 称: 计算机应用技术
指 导 教 师: 姚全珠
申 请 日 期: 2014 年 4 月
万方数据
西安
西安理工大学硕士学位论文
2 2
万方数据
摘要论
摘要
论文题目:基于 KSVM 的中文实体关系抽取研究 学科专业:计算机应用技术
研 究 生:蒲 淼 签 名:
指导教师:姚全珠 教授 签 名:
摘 要
信息抽取的主要目的是将非结构化的文本转换为结构化的信息,这既可以满足人们从 海量信息中得到有价值信息的需求,同时也是信息检索、自动问答系统等方面的基础技术。 实体关系抽取是信息抽取的重要环节,目前已经成为热门的研究课题且具有广阔的应用前 景。在近年的研究中,人们把实体之间的关系抽取转化为分类问题,构造相关的关系实例, 通过机器学习算法训练得到分类器,来判断候选关系属于哪一类预定义关系。
在机器学习算法中,SVM(Support Vector Machine)分类的精确度最高,KNN(K-Nearest Neighbor)居于其次。由于 SVM 所采用的核函数可以将非线性的分类转换为线性的分类问 题,而且具有隐含的高维分类特点,因此基于核函数的实体关系抽取方法成为目前应用最 为广泛的方法。针对采用 SVM 进行分类以及核函数本身在中文实体关系抽取中的不足, 本文的主要工作以及创新点如下:
1. 在基于 SVM 的中文实体关系抽取方法中,错分的样本点大多数都分布在特征空间 中最优分界面的附近,是因为采用 SVM 进行分类时只取一个代表点进行分类,本文针对 这一问题提出了一种基于 KSVM 的中文实体关系抽取的方法。该方法结合 SVM 和 KNN 算法各自的优势,对于在分界面附近的样本点使用 KNN 进行分类,因为使用 KNN 进行 分类时把每一个样本点都看做是代表点;对于离分界面较远的样本点使用 SVM 进行分类。 最后在中文语料库上进行了实验,验证了该方法具有更好的分类效果。
2. 采用基于树核函数方法进行关系抽取时,关系实例结构语法树所包含的信息越丰 富且冗余信息越少,则其抽取效果越好。为此,本文参照 Moschitti 提出的三种树型拓展 结构,提出了一种基于 PartialTree 核函数的中文实体关系抽取方法。该方法依然使用语法 结构树为处理对象,借鉴序列挖掘算法,挖掘出包含更为详细信息的结构化子树,再使用 本文设计的 PartialTree 核函数计算两个关系实例之间的相似度来进行分类。最后通过在中 文语料上的实验证明了该方法的有效性。
关键词:实体关系抽取;SVM;核函数;KNN;PartialTree
I
万方数据
II
Ab
Abstract
Title : RESEARCH ON CHINESE ENTITY RELATION EXTRACTION BASED ON KSVM
Major:Computer Application Technology Name:Miao PU Signature:
Supervisor:Prof.Quanzhu YAO Signature: Abstract
The main purpose of Information Extraction is to transform unstructured text for structured information, it not only can satisfy people to get valuable information from huge amounts of information demand, is also the basis of the Information Retrieval and Automatic Response System. Entity Relation Extraction is an important links in the Information Extraction, has now become a hot research topic and has broad application prospects. In recent study, people regard Entity Relation Extraction as a classification problem, construct relevant relationship instance, and use machine learning algorithm to
您可能关注的文档
- 环境心理学在环境艺术设计中的应用.docx
- 环境学概论试题及答案.doc
- 环境因素识别及评价记录.doc
- 环境因素危险源识别评价.ppt
- 环境影响评价报告公示:废机油收集暂存及转运建设建设单位立基再生资源利用建设地环评报告.doc
- 环境与动物营养.ppt
- 环评工程师复习材料-固体废物污染控制汇总比对记忆.doc
- 环氧树脂浇注绝缘件气泡、杂质缺陷原因分析与研究.docx
- 缓蚀剂对水基环保免清洗助焊剂缓蚀性能的影响.docx
- 换热器介绍及热效率计算.doc
- 基于LabVIEW和数据库的智能高压开关设备用智能组件测试平台的搭建.docx
- 基于MATLAB的改进Canny算子的图像边缘检测研究.docx
- 基于MATLAB的七自由度机器人运动学及工作空间仿真.docx
- 基于MATLAB的无线信道传播特性分析.docx
- 基于Matlab模拟的激光倍频技术实验数据处理.docx
- 基于MODIS的森林火灾预警与检测研究.docx
- 基于NetBIOS名字服务获取MAC地址的原理及实现.docx
- 基于Optistruct脱模约束函数的悬架控制臂拓扑设计.docx
- 基于pcr信号放大的微量蛋白检测技术-邻位连接延伸分析.ppt
- 基于PDCA循环理论的病案首页质量控制.docx
最近下载
- 食材配送服务方案(食材通用方案).docx VIP
- TCECS1424-2023 健康照明设计标准.pdf VIP
- 2024年200MW-400MWh电化学储能电站可行性研究报告.docx
- 2024年中国球团市场调查研究报告.docx
- 正常人体解剖学期末复习资料 正常人体解剖学 模拟试卷(三).doc VIP
- 《装配式混凝土建筑构件生产》课件——设备选型与构件生产区布置.pptx VIP
- 《城镇污水厂MBR扩容提标原位改造技术规程》.pdf VIP
- 云河钢琴谱钢琴简谱数字谱钢琴双手简谱.docx VIP
- 食堂食材配送服务食材安全保证措施食材配送标准方案.pdf VIP
- SY∕T 5677-2019 钻井液用滤纸.pdf
文档评论(0)