网站大量收购独家精品文档,联系QQ:2885784924

基于潜在语义的多类文本分类模型研究 - 江西师范大学智能信息处理 .pdf

基于潜在语义的多类文本分类模型研究 - 江西师范大学智能信息处理 .pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于潜在语义的多类文本分类模型研究 - 江西师范大学智能信息处理

ISSN 1000-0054 ( ) 2005 45 S 1 20/ 39 CN 11-2223/ N J T singh ua U n iv ( Sci T ech ) , 2005, V o . 45 , N o . S 1 1818-1822 基于潜在语义的多类文本分类模型研究 叶 浩,  王明文,  曾雪强 ( , 330027) : 在文本分类中, 一个文本往往有多类属性, 而目前 , 大多数分类模型均为二元分类模型。因此, 提出一种基 潜 , , 在语义的多类分类模型。该模型同时考虑文档特征信息和文 , , 档的类属信息, 在提取文档潜在语义信息的同时把对文档分 , 类贡献大的特征信息保留下来。其结果是既能较好地解决文 档中同义词和多义词的问题, 又能解决多类属分类问题, 并 [ 3] 且能够探测到新类。在Reuter s 文档集上的实验表明, 在维 , 数较低的情况下, 分类效果比较好, 性能比较稳定。 , : 多类分类; 潜在语义; 潜在语义分类; 偏最小二乘 , : T P 391 : A , , : 1000 -0054 ( 2005) S 1-1818-05 , Automatic text multi-classification , [ 4] model based on latent semantic ( PL S 1 YE Hao, WANG Mingwen, Z ENG Xueqiang ) , , ( School of Computer Information Engineering, Jiangxi Normal University, Nanchang 3300 7, China) , Abstract: In t he aut omat ic t ext c ass ificat ion, one t ex t m ay b e ong , t o severa c ass es , but m ost of ex ist ed c as sif icat ion m ode s are 1 多分类的潜在语义模型 binary mode s. T h is paper pr esent s a new mu t i-c assif icat ion m ode based on at ent seman tic i n w hich bot h t he t ext inf ormat ion and t he L SI[ 5] , t ext c as s inf ormat ion are t aken int o accou nt . It keeps t he import an t f eat ure

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档