- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优先出版计算机应用研究第卷基于动词名词和特征选择的中文人物社会关系抽取曾辉唐佳丽熊李艳黄晓辉华东交通大学信息工程学院南昌摘要针对中文人物社会关系标注语料库的匮乏和人物关系分类过于粗糙的问题采用一种简单的方式标注了八类主要人物社会关系为了有效的降低特征向量的维数避免维数灾难并尽可能去除噪声特征以提高关系抽取的准确率提出一种基于动词和名词抽取与统计量法相结合的特征选择方法并使用计算特征权重通过分类器进行实验值和正确率都得到了提高为了充分利用数据集对该特征选择方法的效果进行测试使用折交叉验证检验该方法
优先出版 计 算 机 应 用 研 究 第33 卷
基于动词名词和CHI 特征选择的中文人物社会关系抽取*
曾 辉,唐佳丽,熊李艳,黄晓辉
(华东交通大学 信息工程学院,南昌 330013)
摘 要:针对中文人物社会关系标注语料库的匮乏和人物关系分类过于粗糙的问题,采用一种简单的方式标注了八类主
要人物社会关系。为了有效的降低特征向量的维数避免维数灾难,并尽可能去除噪声特征以提高关系抽取的准确率,提
出一种基于动词和名词抽取与χ2 统计量法(CHI)相结合的特征选择方法,并使用TF-IDF 计算特征权重。通过SVM
分类器进行实验,F 值和正确率都得到了提高。为了充分利用数据集对该特征选择方法的效果进行测试,使用K-折交叉
验证检验该方法的有效性,实验表明通过该方法产生的分类模型具有较强的区分能力和泛化能力。
关键词:人物关系抽取;人物关系标注;特征选择;CHI ;SVM 分类器
中图分类号:TP391
Personal social relation extraction in Chinese based on feature selection of CHI verb and noun
Zeng Hui, Tang Jiali, Xiong Liyan, Huang Xiaohui
(School of Information Engineering, East China Jiaotong University, Nanchang 330013, China)
Abstract: Due to the scarce of labeled Chinese corpus of social relation and the rough classification of personal social relations,
eight main types of personal social relation was labeled by a simple method in this paper. It is necessary to reduce the dimension
of feature vector effectively to avoid the curse of dimensionality and remove the noise characteristics to improve the accuracy of
relation extraction, therefore, this paper proposed a feature selection method based on Chi square statistic combination with
selection of verb and noun, and used TF-IDF to calculate weight of the feature items. After feature selection, the proposed
method was tested by SVM classifier, and the results of F-Score and accuracy are improved. In order to make full use of the data
set to test the effect of this feature selection method, the validity of the proposed method was tested by using k-fold cross
validation. Experimental results
您可能关注的文档
- 基于bayes理论的五轴加工中心mtbf指标预测方法-journalof.pdf
- 基于bp神经网络与ds证据理论的路段平均速度-交通运输工程学报.pdf
- 基于cart算法的夏季干旱预测模型研究及应用-气象科学.pdf
- 基于d2s证据理论的多水库联合调度方案评价-水科学进展.pdf
- 基因科技造福人类解读生命奥秘谱写产业华章体验精彩人生-华大基因.pdf
- 基于cfd的温室气温时空变化预测模型及通风调控措施-农业工程学报.pdf
- 基于dsp的混合动力汽车永磁同步电机的矢量控制系统-中国工程科学.pdf
- 基于eemd和svr的多自由度结构状态趋势预测-应用力学学报.pdf
- 基于ekf和smc的永磁同步电机无传感器矢量控制-信息与控制.pdf
- 基于gm11的棉花期货价格预测模型.doc
- 基于第三方视角的基本公共卫生服务满意度的纵向研究-中国全科医学.pdf
- 基于电子健康档案的区域卫生信息平台建设研究①-湖南科技大学.pdf
- 基于多目标差分进化算法的结构物理参数辨识-地震工程与工程振动.pdf
- 基于多情绪源关联模型的中文微博情感分析-智能系统学报.pdf
- 基于动态因果模型研究盐酸哌甲酯对大脑默认网络效应连接的调制作用.pdf
- 基于多因素修正的结构件疲劳寿命预估方法-东南大学学报.pdf
- 基于多智能体的城镇家庭用水量模拟预测分析-水利学报.pdf
- 基于多源遥感影像的多尺度城植被覆盖度估算.doc
- 基于多智能体技术的智能电网信息管理系统研究-现代电力.pdf
- 基于多智能体系统的钻井异常情况诊断技术倡-天然气工业.pdf
最近下载
- 家居装饰行业大数据精准营销策略分析报告.docx
- SH217_03ERP项目_MM物资组关键方案介绍_收货_v1.1-.pptx VIP
- 格物入门. 第1-7卷 丁韪良 著 同治7年 北京 同文馆1.pdf VIP
- 电磁场的对称性分析.pdf VIP
- 传感器基础教科书原理和特点讲解.pdf VIP
- TCBDA51-2021 住宅装饰装修工程施工技术规程.pdf VIP
- 最新人教版九年级数学下册 全册教学课件全集(858张).ppt VIP
- TCBDA 55-2021 住宅室内装饰装修工程质量验收标准.docx VIP
- SH217_03ERP-2_详细业务蓝图及解决方案_3.1-神朔修改后.docx VIP
- 2025年重庆市中考数学试卷(含标准答案)原卷.pdf
文档评论(0)