- 139
- 0
- 约2.76万字
- 约 42页
- 2016-04-12 发布于辽宁
- 举报
摘 要
聚类作为一种知识发现的重要方法,它广泛地与中文信息处理技术相结合,应用于网络信息处理中以满足用户快捷地从互联网获得自己需要的信息资源。文本聚类是聚类问题在文本挖掘中的有效应用,它根据文本数据的不同特征,按照文本间的相似性,将其分为不同的文本簇。其目的是要使同一类别的文本间的相似度尽可能大,而不同类别的文本间的相似度尽可能的小。整个聚类过程无需指导,事先对数据结构未知,是一种典型的无监督分类。
本文首先介绍了文本聚类的相关的技术,包括文本聚类的过程,文本表示模型,相似度计算及常见聚类算法。本文主要研究的聚类主要方法是k-均值和SOM算法,介绍了两种算法的基本思想和实现步骤,并分析两种算法的聚类效果。同时介绍了两种算法的改进算法。
关键词:文本聚类 聚类方法 K-MEAN SOM Abstract
Clustering as an important knowledge discovery method, which extensively with Chinese information processing technology, used in network information processing to meet the users to quickly access from the Internet, the information
您可能关注的文档
- 基于uc3843控制的充电器电路设计大学本科生毕业设计(论文).doc
- 基于uc3844通用变频器辅助电源的研究设计本科生毕业(设计)论文.doc
- 基于udk技术的虚拟博物馆仿真系统设计与实现本科生毕业(设计)论文.doc
- 基于udp网络通信系统的服务端程序设计课程大学本科生毕业设计(论文)报告.doc
- 基于ug奥迪汽车车身的曲面设计与加工本科生毕业(设计)论文.doc
- 基于ug的曲轴的数控加工本科生毕业(设计)论文.doc
- 基于ug的填料箱盖的工艺规程及夹具设计大学本科生毕业设计(论文).doc
- 基于usb接口的编程器的设计本科生毕业(设计)论文说明书.doc
- 基于v__b的图书馆管理系统的设计本科生毕业(设计)论文.doc
- 基于vb6.0的数据提取软件设计大学本科生毕业设计(论文).doc
最近下载
- PLC中药自动发药机设计.pdf VIP
- pdf格式个人简历 .pdf VIP
- 生产线自动化设备操作与维护手册.docx VIP
- 【计量方法】福建三明林业碳票计量方法.docx
- 2024年石家庄市市属国有企业招聘真题.docx VIP
- 专题3.2.3非谓语动词之动词不定式 (冲击双一流单句语法填空100题 + 原创代词、冠词语法填空1篇)教师版.docx VIP
- 苏锡常镇四市2026届高三(一模)英语试卷(含答案及解析).pdf
- 苏锡常镇四市2026届高三(一模)物理试卷(含答案).pdf
- 2024届江苏省苏锡常镇高三一模语文试题 讲评课件.pptx VIP
- 苏锡常镇四市2026届高三(一模)地理试卷(含答案).pdf
原创力文档

文档评论(0)