- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于特征组合的中文实体关系抽取
27 4 2010 4
M ICROEL ECT RONICS COM PUT ER
Vol. 27 No. 4 April 2010
黄 鑫1, 2, 朱巧明2 , 钱龙华2, 刘梅梅1, 2
(1
, 215006; 2
, 215006)
: 结合中文关系抽取的要求, 以 ACE2005 的中文语料 为数据进 行关系抽 取实验. 在抽 取中文词 法 实体 句
法, 语法基本特征后, 提出采用特征组合方法, 使用支持 向量机的机 器学习 ( SVM ) 方 法, 在上关系 探测和 关系大 类
上 F 值分别提高了 1. 36% 和 3. 97% , 达到 72. 77 和 61. 03, 并分析出各部分组合特征的贡献. 实验数据表明词语 和
实体组合特征对中文关系抽取的作用较大.
: 中文关系抽取; 信息抽取; ACE2005; 支持向量机; 特征组 合
: T P393
: A : 1000- 7180( 2010) 04- 0198- 03
Chinese Entity Relation Extraction Based on Features Combination
HU ANG Xin1, 2, ZHU Q iao ming2 , QIAN Long hua2, L IU M ei mei1, 2
( 1 K ey Lab of Co mputer Information Processing T echnolog y of Jiangsu Province, Suzhou 215006, China; 2 School of Computer Science T echnolog y, Soochow University, Suzhou 215006, China)
Abstract: T his paper carried out a series of ex periments on Chinese relation extraction classification based on standard and tr aining corpus of ACE2005 ( Automatic Content Extraction 2005) . It explores w ord, entity, syntax, gr am featur es in Chinese at first, and then present a method which co mbines these basic featur es. T he F- score of Chinese relation extr ac tion for Relation Detect ion and six major types in ACE2005 Chinese corpo ra impr oves 1. 36% and 3. 97% and achieves 72. 77 and 61. 03 respectively in SVM , then g ive the contribution of differ ent combined features. It illustrates that the combined features of words and entities are very effective for Chinese R elatio n Extraction. Key words: Chinese relation ex tract ion; information extraction; ACE2005; SV M ; feature combination
1
,,
..
( NIST )
( Automatic Cont ent Ext ract ion, ACE) , A CE2005[ 1]
2
7 2. 1
,
6
[2 4] .
[ 5 6]
,
. ACE2005
,,
. ,
,
[ 7]
. ,
: ;
: 2009- 03- 12; :
: 2009- 06- 12 ( 2006AA 01Z147) ;
(
4 ,:
; ,.
,
., ,
, 2. 2
.
, , , 1.
.
,
, ,
BW M1 BWM1 MW1 BWF BW O BW L MW2 BWM 2 B WM2
FL
FL
, M W1: BWM1F : 1 1 BWO:
; BWM2L: 2. 3
, 2
1
1 ; MW2:
2;
; BWM1L:
; BWF:
;
; BWL :
; BWM2F :
2.
ACE
.
,
.
Ent it y7- 9GPE| Populat ion- Cent
原创力文档


文档评论(0)