基于SVM的网络文本信息自动分类.PDFVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM的网络文本信息自动分类

研究与开发 基于SVM的网络文本信息自动分类* , 刘 清12 , 陈 炼1 , 吕 静1 南昌大学计算中心 南昌 江西财经大学 南昌 ( , ; , ) 1. 3300312. 330031 摘 要:介绍基于 的网络文本信息自动分类算法 该算法在训练阶段将一个大型数据集分 SVM , 成许多不相交的子集 按批次对各个训练子集中的样本进行训练而得到多个分类器 利 , , 用误差纠错输出编码优化分类器,从而减少较深层次训练需要学习的文档。 关键词 支持向量机 自动分类 多层分类 误差纠正输出编码 : ; ; ; 0 引 言 它能很好地解决有限数量样本的高维模型构造问题, 而且所构造的模型具有很好的预测性能。 由于互联网上可用信息的迅速增长 人们迫切需 , 2.1SVM算法原理 要能够更好地发现 过滤和管理这些资源的技术 文 、 。 本分类[1,2] 是在给定的分类体系下, SVM通过适当选择函数子集及该子集中的判别 (TextClassification) 函数使学习机的实际风险达到最小 通过有限样本的 把自然语言的文本按其内容划分到一个或多个预先 , 训练而得到小误差分类器,对独立测试集的测试后保 定义好的类别 是信息组织 主题分析和知识管理的 , 、 证小误差 得到一个具有最优分类能力和推广泛化能 有效方法 如何利用智能方法快速有效地协助人工对 , 。 力的学习机[4]。 文本信息进行分类已经成为当前信息服务和知识发 现的重要研究热点 本文介绍一种基于 的网络 。 SVM H1 H 文本信息自动分类算法 该方法研究在有限样本情况 。 H2 下的机器学习规律 具有相对较高的性能指标 可以广 , , 泛应用于网上文本信息自动分类。 margin 1 基于统计的文本自动分类

文档评论(0)

yanmei520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档