- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息技术第卷第期年月基于理论的文本自动聚类研究常娥东南大学图书馆南京东南大学科技情报研究所南京摘要结合潜性语义索引理论和聚类法提出一种改进的文本自动聚类方法即首先利用统计法抽取文档关键词并应用潜性语义索引对构建文档的向量空间模型进行降维然后采用算法进行文本聚类实验表明该算法进行文本聚类的准确度最高可达关键词文本聚类模型算法算法分类号然后将对象归为特征最接近的一类并赋予相应的分类引言类别因此文本自动归类需要事先建立类别体系然后按照某种标准对文本进行归类处理网络数字资源信息量巨大人们在浏览网页时对鉴
>>
<<信息技术
第56卷 第11期 2012年6月
基于 LSI理论的文本自动聚类研究
常 娥
东南大学图书馆 南京210096 东南大学科技情报研究所 南京210096
〔摘要〕结合潜性语义
您可能关注的文档
- 货币政策效应非对称性研究 - 中国金融论坛.pdf
- 获得检定的临界值.ppt
- 获得关注 - elsevier publishing campus.pdf
- 获取和保留玩家 - akamai.pdf
- 机场运营管理 - sita.pdf
- 机构 - 宁波市科技局.ppt
- 机率统计ⅱ.pdf
- 霍尼韦尔智能安灯系统产品彩页.pdf
- 机器人倾倒碰撞动力学建模与不同刚度下碰撞响应 - ingenta connect.pdf
- 机器学习的发展历程及启示 - 中国计算机学会.pdf
- 基于lucene索引的数据库全文检索 - 吉林大学学报.pdf
- 基于mapreduce 的pca 异常流量检测系统实现 - 信息通信学术期刊网.pdf
- 基于mapreduce 的可扩展协同聚类算法 - 江西师范大学智能信息处理 .pdf
- 基于mapreduce 的倒排索引的建立.pdf
- 基于mapreduce 模型的电力数据并行化的异常检测 - 中国云计算.pdf
- 基于mapreduce的数据立方体分区优化算法研究 - 中国云计算.pdf
- 基于mapreduce的封闭立方体并行计算方法.pdf
- 基于mapreduce框架的海量数据相似性连接研究进展 - 中国云计算.pdf
- 基于md5去重树的网络爬虫的设计与优化 - 计算机应用与软件.pdf
- 基于morris 法的单裂隙岩体温度场参数灵敏度分析 - 采矿与安全工程学报.pdf
文档评论(0)