- 20
- 0
- 约2.76万字
- 约 40页
- 2016-05-22 发布于辽宁
- 举报
基于文本的聚类算法研究-本科毕业设计论文
摘 要
聚类作为一种知识发现的重要方法,它广泛地与中文信息处理技术相结合,应用于网络信息处理中以满足用户快捷地从互联网获得自己需要的信息资源。文本聚类是聚类问题在文本挖掘中的有效应用,它根据文本数据的不同特征,按照文本间的相似性,将其分为不同的文本簇。其目的是要使同一类别的文本间的相似度尽可能大,而不同类别的文本间的相似度尽可能的小。整个聚类过程无需指导,事先对数据结构未知,是一种典型的无监督分类。
本文首先介绍了文本聚类的相关的技术,包括文本聚类的过程,文本表示模型,相似度计算及常见聚类算法。本文主要研究的聚类主要方法是k-均值和SOM算法,介绍了两种算法的基本思想和实现步骤,并分析两种算法的聚类效果。同时介绍了两种算法的改进算法。
关键词:文本聚类 聚类方法 K-MEAN SOM Abstract
Clustering as an important knowledge discovery method, which extensively with Chinese information processing technology, used in network information processing to meet the users to quickly access from the Internet, the information
您可能关注的文档
- 基于plc的自动售货机系统设计-本科毕业设计论文.doc
- 基于plc和变频器的集中供热换热站节能控制系统设计_大学生毕业设计(论文).doc
- 基于plc控制的电热锅炉_大学生毕业设计(论文).doc
- 基于plc控制的锅炉供热控制系统设计-本科毕业设计论文说明书.doc
- 基于plc的平面运动控制研究_大学生毕业设计(论文).doc
- 基于plc的远程三层电梯控制系统--本科毕业设计论文.doc
- 基于plc污水处理控制系统_大学生毕业设计(论文).doc
- 基于proe的齿轮模型库二次开发-本科毕业设计论文.doc
- 基于plc温度控制系统的设计--_大学生毕业设计(论文).doc
- 基于pspice四阶带通滤波器的设计与实现-本科毕业设计论文.doc
最近下载
- 2025广东广州花都城投汇鑫运营管理有限公司招聘工作人员7人备考题库及答案解析.docx VIP
- V型滤池例题的设计计算.ppt VIP
- 2025年注册结构工程师《结构工程设计与施工工艺》备考题库及答案解析.docx VIP
- AP统计学 2019年真题 (选择题+问答题) AP Statistics 2019 Real Exam and Answers (MCQ+FRQ).pdf VIP
- 安徽省C20教育联盟2025-2026年九年级下三模数学试卷.docx VIP
- 2025年净水厂V型滤池设计.pdf VIP
- Q/GDW 11398-2015 变电站设备监控信息规范.pdf VIP
- 闪光灯430exii中文说明书.pdf VIP
- 结构工程设计题库及答案.doc VIP
- YS∕T 670-2021 空调器连接用保温铜管.pdf
原创力文档

文档评论(0)