网站大量收购独家精品文档,联系QQ:2885784924

基于SVM和k2NN结合的汉语交集型歧义切分方法①.PDFVIP

基于SVM和k2NN结合的汉语交集型歧义切分方法①.PDF

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM和k2NN结合的汉语交集型歧义切分方法①.PDF

中 文  信  息  学  报 第 15 卷 第 6 期   JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 15 No. 6 基于 SV M 和 kNN 结合的汉语 交集型歧义切分方法① 1 2 1 2 李  蓉  刘少辉  叶世伟  史忠植 ( ( ) 1. 中国科技大学研究生院 北京 计算机教学部  北京  100039 ; 2 . 中国科学院计算技术研究所智能开放实验室  北京  100080) ( ) ( ) 摘要 :本文提出了基于支持向量机 SV M 和 k近邻 kNN 相结合的一种分类方法 ,用于 解决交集型伪歧义字段 。首先将交集型伪歧义字段的歧义切分过程形式化为一个分类过程并 给出一种歧义字段的表示方法 。求解过程是一个有教师学习过程 ,从歧义字段中挑选出一些 高频伪歧义字段 ,人工将其正确切分并代入 SV M 训练 。对于待识别歧义字段通过使用 SV M 和 kNN 相结合的分类算法即可得到切分结果 。实验结果显示使用此方法可以正确处理 9 1. 6 %的交集歧义字段 ,而且该算法具有一定的稳定性 。 关键词 :支持向量 ;类代表点;交集型歧义 ;汉语自动分词 中图分类号 : TP39 1. 1 A Method of Crossing Ambiguities in Chinese Word Segmentation Based on SVM and kNN 1 2 1 2 L I Rong  L IU Shaohui  YE Shiwei  SH I Zhongzhi ( 1. Dep art ment of Comp uter , Graduate School ,Science and Technology U niver sity of China  Beij ing  100039 ; 2 . Instit ute of Comp uting Technlolgy ,Chinese Academy of Sciences  Beij ing  100080) Abstract :This p aper p resent s an algorit hm based on t he combination of Support Vector Maching ( SV M) and k Nearest neighbor (kNN) ,to deal wit h ambiguities in Chinese wor d segment ation . We regar d t he ambiguities segment ation as a classified p roblem and p ropo se a vector rep resent ation of t hem . The met hod to find t he solutions is supervised learning . After t he ambiguities being se lected and classified by handwork ,t he ambiguities wit h high frequency are t rained by SV M . For t he test hing ambiguities ,we classify it

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档