- 135
- 0
- 约2.99万字
- 约 42页
- 2017-04-21 发布于辽宁
- 举报
基于文本的聚类算法研究
PAGE 8
PAGE II
摘 要
聚类作为一种知识发现的重要方法,它广泛地与中文信息处理技术相结合,应用于网络信息处理中以满足用户快捷地从互联网获得自己需要的信息资源。文本聚类是聚类问题在文本挖掘中的有效应用,它根据文本数据的不同特征,按照文本间的相似性,将其分为不同的文本簇。其目的是要使同一类别的文本间的相似度尽可能大,而不同类别的文本间的相似度尽可能的小。整个聚类过程无需指导,事先对数据结构未知,是一种典型的无监督分类。
本文首先介绍了文本聚类的相关的技术,包括文本聚类的过程,文本表示模型,相似度计算及常见聚类算法。本文主要研究的聚类主要方法是k-均值和SOM算法,介绍了两种算法的基本思想和实现步骤,并分析两种算法的聚类效果。同时介绍了两种算法的改进算法。
关键词:文本聚类 聚类方法 K-MEAN SOM Abstract
Clustering as an important knowledge discovery method, which extensively with Chinese information processing technology, used in network information processing to meet the users to quickly acces
您可能关注的文档
- 基于红外传感器的公共场所人流量统计系统设计_学位论文.doc
- 基于顾客满意度的包百大楼竞争力分析_毕业论文.doc
- 基于光电感烟探测器的火灾报警系统设计__毕业论文.doc
- 基于计算机控制的光碟智能存取装置研制__毕业论文.doc
- 基于家电下乡政策下的农村家电市场渠道建设创新研究以海尔网格化建设经验为例_学位论文.doc
- 基于激光扫描的智能往返跑控制系统设计__学位论文.doc
- 基于家政公司网站的设计方案说明书()__学位论文.doc
- 基于家政公司网站的设计说明书()_学位论文.doc
- 基于精准营销目标的网络广告运作模式研究_毕业论文.doc
- 基于经济增加值的企业绩效评价研究_毕业论文.doc
最近下载
- 中国药典--四部通则-9205-药品洁净实验室微生物监测和控制指导原则.doc VIP
- 罚款单 处罚单(标准模板).docx VIP
- 高中数学第18讲 解析几何中用导数分析的几种问题.docx VIP
- 2026年全民国家安全教育日:统筹发展和安全+护航十五五新征程PPT课件.pptx VIP
- 河南省机关事业单位工考图书资料员复习资料.doc VIP
- 人教版高考生物真题汇编:DNA分子结构和复制(word版 有答案).docx VIP
- LKXA立式斜流样本说明书.doc VIP
- 河南省机关事业单位工考图书资料员复习资料.doc VIP
- 注册安全工程师考试建筑施工(初级)安全生产实务重点难点精练试题精析.docx VIP
- 《用水定额 第2部分:工业》DB43T 388.2-2025.docx VIP
原创力文档

文档评论(0)