- 5
- 0
- 约2.76万字
- 约 40页
- 2015-12-07 发布于辽宁
- 举报
摘 要
聚类作为一种知识发现的重要方法,它广泛地与中文信息处理技术相结合,应用于网络信息处理中以满足用户快捷地从互联网获得自己需要的信息资源。文本聚类是聚类问题在文本挖掘中的有效应用,它根据文本数据的不同特征,按照文本间的相似性,将其分为不同的文本簇。其目的是要使同一类别的文本间的相似度尽可能大,而不同类别的文本间的相似度尽可能的小。整个聚类过程无需指导,事先对数据结构未知,是一种典型的无监督分类。
本文首先介绍了文本聚类的相关的技术,包括文本聚类的过程,文本表示模型,相似度计算及常见聚类算法。本文主要研究的聚类主要方法是k-均值和SOM算法,介绍了两种算法的基本思想和实现步骤,并分析两种算法的聚类效果。同时介绍了两种算法的改进算法。
关键词:文本聚类 聚类方法 K-MEAN SOM Abstract
Clustering as an important knowledge discovery method, which extensively with Chinese information processing technology, used in network information processing to meet the users to quickly access from the Internet, the information
您可能关注的文档
- 基于opencv的图像识别大学毕业论文(设计).doc
- 基于osgi框架的网络操作工单管理系统的设计与实现本科生毕业论文.doc
- 基于pca的人脸识别算法实现大学毕业论文(设计).doc
- 基于php教育培训管理系统大学毕业论文(设计).doc
- 基于plc的5层电梯控制系统的设计大学毕业论文(设计).doc
- 基于plc的步进电动机的控制系统大学毕业论文(设计).doc
- 基于plc的纯水处理系统大学毕业论文(设计).doc
- 基于plc的电梯控制系统设计大学毕业论文(设计).doc
- 基于plc的电梯群控的应用研究大学毕业论文(设计).doc
- 基于plc的风力发电控制系统设计---大学毕业论文(设计).doc
最近下载
- 全国现场流行病学调查职业技能竞赛备考试题库及答案.docx VIP
- 单克隆抗体开发中的电荷异质性.docx VIP
- 合肥科技职业学院《破产法》2025-2026学年期末试卷.docx VIP
- 合肥科技职业学院《人际传播与沟通》2025-2026学年期末试卷.docx VIP
- 2014级口腔疾病概要课程标准.doc VIP
- 默纳克协议代码表、常见电梯系统密码表.docx VIP
- 宁夏纪委监委公开遴选公务员笔试试题及答案解析.docx VIP
- 合肥科技职业学院《商业银行业务与经营》2025-2026学年期末试卷.docx VIP
- 2025《某小区GPON光纤接入网的设计方案》12000字.doc VIP
- 合肥科技职业学院《社区工作》2025-2026学年期末试卷.docx VIP
原创力文档

文档评论(0)