一种基于复杂网络中文文本分类算法.pdfVIP

一种基于复杂网络中文文本分类算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1胃 瑕 W--瑕 ISSN1000—0135 JOURNALOFTHECHINA SOCIETYF0R SCIENTIFIC AND TECHNICAL INFORMATION 1SSN lO0o—O135 第31卷第 11期 1179—1186,2012年 11月 Vo1.31 No.11,1179—1186 November 2012 doi:10.3772/j.issn.1000—0135.2012.11.007 一 种基于复杂 网络的中文文本分类算法 赵 辉 刘怀亮 张 倩 (西安电子科技大学经济管理学院,西安 710071) 摘要 为解决向量空间模型中文本结构和语义信息的缺失问题,本文提出将复杂网络应用到中文文本分类过 程中,将文本表示为以特征词为节点 ,以词语语义相关关系为边 ,以其相关关系强弱作为边权重 的加权复杂网络 , 利用网络节点的综合特性对文本进行特征选择 ,以降低文本 网络的复杂性 。给出基于复杂网络 的中文文本分类算 法并对其进行实验验证 。结果表 明,该算法是可行 的,且有较好 的分类效果 。 关键词 复杂网络 特征选择 文本分类 A ChineseTextClassificationAlgorithm Based on ComplexNetwork ZhaoHui,LiuHuailiangandZhangQian (DepartmentofEconomicManagement,XidianUnwe~i@,Xi’an710071) Abstract Inordertodealwiththelack oftextstructureand semanticinformati0ninthevect0rspacemode1.this paperappliescomplexnetwork to theprocessofChinesetextclassification.Itwillrepresentthetextsasnodesoffeature words,andputthe semantic relevancerelation ofbetweenwordsastheedges,and usethe strength ofthatrelevance relation asweightedcomplexnetworkofedgeweight,andachievethefeatureselectionoftextsbyconsideringthesynthetic characteristicsofnetworknodes,then toreducethenetwork complexity ofthetexts.Itcan alsoproposean algorithm of Chinesetextclassificationandproveitselfbyexperiments.Theexperimentalresultsshow thatthealgorithm isfeasibleand ofbetterclassi6cationresults. Keywords complexnetwork,featureselection,textclassification 信息 ,因此在处理海量信息时,此模型带来的最大问 1 引 言 题是 向量空间的高维性、稀疏性及语义信息缺失问 题 ,从而影响文本分类的结果。 文本分类作为文本挖掘的关键技术之一,广泛

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档