- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM和k2NN结合的汉语交集型歧义切分方法①.PDF
中 文 信 息 学 报
第 15 卷 第 6 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 15 No. 6
基于 SV M 和 kNN 结合的汉语
交集型歧义切分方法①
1 2 1 2
李 蓉 刘少辉 叶世伟 史忠植
( ( )
1. 中国科技大学研究生院 北京 计算机教学部 北京 100039 ;
2 . 中国科学院计算技术研究所智能开放实验室 北京 100080)
( ) ( )
摘要 :本文提出了基于支持向量机 SV M 和 k近邻 kNN 相结合的一种分类方法 ,用于
解决交集型伪歧义字段 。首先将交集型伪歧义字段的歧义切分过程形式化为一个分类过程并
给出一种歧义字段的表示方法 。求解过程是一个有教师学习过程 ,从歧义字段中挑选出一些
高频伪歧义字段 ,人工将其正确切分并代入 SV M 训练 。对于待识别歧义字段通过使用 SV M
和 kNN 相结合的分类算法即可得到切分结果 。实验结果显示使用此方法可以正确处理 9 1.
6 %的交集歧义字段 ,而且该算法具有一定的稳定性 。
关键词 :支持向量 ;类代表点;交集型歧义 ;汉语自动分词
中图分类号 : TP39 1. 1
A Method of Crossing Ambiguities in Chinese Word
Segmentation Based on SVM and kNN
1 2 1 2
L I Rong L IU Shaohui YE Shiwei SH I Zhongzhi
( 1. Dep art ment of Comp uter , Graduate School ,Science and Technology U niver sity of
China Beij ing 100039 ;
2 . Instit ute of Comp uting Technlolgy ,Chinese Academy of Sciences Beij ing 100080)
Abstract :This p aper p resent s an algorit hm based on t he combination of Support Vector Maching
( SV M) and k Nearest neighbor (kNN) ,to deal wit h ambiguities in Chinese wor d segment ation .
We regar d t he ambiguities segment ation as a classified p roblem and p ropo se a vector rep resent ation
of t hem . The met hod to find t he solutions is supervised learning . After t he ambiguities being se
lected and classified by handwork ,t he ambiguities wit h high frequency are t rained by SV M . For
t he test hing ambiguities ,we classify it
您可能关注的文档
- 城镇道路工程-阳泉市市政工程管理局内部信息网.doc
- 埕岛东斜坡下第三系层序地层与油气分布规律-石油勘探与开发.PDF
- 埠序列扩充盒-Aten.PDF
- 培训师职业化技能与素养提升培训PPT_64.ppt
- 培训班简章-辅英科技大学.doc
- 基于!!的多端直流输电系统阻抗频率特性研究-电力建设.PDF
- 基于12于的彩色图像三维D变换压缩I码-OALib.PDF
- 基于AHP方法的空港物流竞争力评价.doc
- 基于Arnold置乱和Hadamard变换的双水印信号预处理算法.PDF
- 基于AR参数的液压阀故障信号检测-Core.PDF
- 基于TweedieGAM模型的热带大西洋拟锥齿鲨单位-应用生态学报.PDF
- 基于UC3875的双闭环控制稳流型开关电源.PDF
- 基于UG平台的派力奥轿车后横梁焊接夹具中压杆的有限元强度校核#.PDF
- 基于Vague集的次协调数据库的研究-计算机工程与应用.PDF
- 基于×ù的农业决策支持系统研究-安徽农业科学.PDF
- 基于一种新的核函数的模糊粗糙集-计算机科学.PDF
- 基于一般二元关系的多粒度粗糙集模型-JournalOfNUAA-南京航空.PDF
- 基于一般矩的重尾分布的控制函数类的若干性质(1.283Mb).PDF
- 基于专业认证的材控专业课程体系建设-DPIProceedings.PDF
- 基于严凸函数的知识粒度与相对粒度-模式识别与人工智能.PDF
文档评论(0)