- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于隐马尔科夫模型的文本分类-石家庄铁道大学学报自然科学版
26 1 ( ) Vol. 26 No. 1
第 卷 第 期 石家庄铁道大学学报 自然科学版
20 13 3 JOURNAL OF SHIJIAZHUANG TIEDAO UNIVERSITY (NATURAL SCIENCE) Mar. 20 13
年 月
基于隐马尔科夫模型的文本分类
,
刘晓飞 邸书灵
( , 050043)
石家庄铁道大学信息科学与技术学院 河北石家庄
: , 。
摘要 文本分类经过多年的发展 已经产生了很多成熟高效的算法 将隐马尔科夫模型用
, ,2 ,
于文本分类 对每个文本类构建一个隐马尔科夫模型 χ 检验获得类别特征词集 其状态转移表
, ,
示按照一指定顺序对类别特征词集进行遍历 状态输出符号为特征词的词频 隐马尔科夫模型
。 HMM
的状态转移过程隐含的表示了属于该类的文本的形成过程 具有最大概率的 分类器就是
。 , ,
所属的类别 该算法不仅将特征词考虑进去 而且还将词频信息融入隐马尔科夫模型中 实验
结果表明该方法分类效率较高。
2
: ; ; ; ;
关键词 文本分类 隐马尔科夫模型 信息增益 χ 检验 泊松分布
中图分类号:TP182 文献标识码:A 文章编号:2095 0373 (20 13)0 1 0 10 1 06
0 引言
, , ,
近些年来随着网络的不断发展 各种信息的增长速度越来越快 其中文本信息占有重要地位 面对这
, 、 ,
些越来越多的信息 如何快速而有效的进行组织 管理以及使用是当今信息处理的一个重要课题 而这也
促进了文本分类技术的发展。
。
文本分类就是将未分类的文本根据一定的分类算法分配到正确的类别中 文本分类的应用十分广
, 、 、 、 。
泛 在搜索引擎 信息过滤 文本识别 数字图书馆等方面均已成为关键技术之一
, 。 SVM
文本分类发展至今 已经产生了很多种模型和算法 在文本分类中比较常用的分类算法有 算
[1] [2] [3
您可能关注的文档
- 图像自动语义标注技术综述.PDF
- 图像购物搜索技术研究综述.PDF
- 图像重排序中与查询相关的图像相似性度量.PDF
- 土-结构体系的混合约束模态法在ANSYS中实施研究1.PDF
- 土地新政为北大荒农发种业资产整合制度松绑.PDF
- 图们江干流悬移尾矿砂迁移规律.PDF
- 土壤微生物多样性研究方法概述.PDF
- 土地利用变化的地形梯度特征与空间扩展.PDF
- 图像购物搜索技术研究综述①.PDF
- 土壤水分含量对菖蒲.PDF
- 基于认知任务я析的诊信息系统设计与实施-北京协和医院.PDF
- 基于非农化和生态约束的农地整理区位的选择-IngentaConnect.PDF
- 基于文献计量方法的国际地理科学研究机构竞争力分析-Journalof.PDF
- 基于模糊分析方法的我国物流产业国际竞争力评价研究-中国机械工程.PDF
- 基于系统耦合视角的京津冀城镇化协调发展评价.PDF
- 基于客户感知验证的服务质量差距管理体系研究-中国联通.PDF
- 基因测序技术在中药质量研究中的应用Ⅱ.PDF
- 基因聚类分析中数据预处理方式和相似度的选择".PDF
- 基础强化练六名篇名句默写专项练基础组合练6.DOC
- 基于高通量测序的犏牛囊胚玻璃化冷冻损伤机制研究.PDF
原创力文档


文档评论(0)