- 13
- 0
- 约2.76万字
- 约 42页
- 2018-05-04 发布于河北
- 举报
基于文本的聚类算法研究毕业论文 推荐
摘 要
聚类作为一种知识发现的重要方法,它广泛地与中文信息处理技术相结合,应用于网络信息处理中以满足用户快捷地从互联网获得自己需要的信息资源。文本聚类是聚类问题在文本挖掘中的有效应用,它根据文本数据的不同特征,按照文本间的相似性,将其分为不同的文本簇。其目的是要使同一类别的文本间的相似度尽可能大,而不同类别的文本间的相似度尽可能的小。整个聚类过程无需指导,事先对数据结构未知,是一种典型的无监督分类。
本文首先介绍了文本聚类的相关的技术,包括文本聚类的过程,文本表示模型,相似度计算及常见聚类算法。本文主要研究的聚类主要方法是k-均值和SOM算法,介绍了两种算法的基本思想和实现步骤,并分析两种算法的聚类效果。同时介绍了两种算法的改进算法。
关键词:文本聚类 聚类方法 K-MEAN SOM Abstract
Clustering as an important knowledge discovery method, which extensively with Chinese information processing technology, used in network information processing to meet the users to quickly access from the Internet, the information
您可能关注的文档
- 炼油厂管式加热炉工艺设计_毕业论文 指导老师刘宝.doc
- 煤与瓦斯突出防治技术讲座(教案).doc
- 煤业公司矿井兼并重组整合项目初步设计说明书.doc
- 煤油冷却器课程设计说明书.doc
- 煤制尿素项目动力分场_锅炉引风机及其系统调试方案 张海涛.doc
- 煤油冷却器的设计课程设计任务书.doc
- 煤油加氢反应器出口冷却器结构和强度计算毕业设计论文 吉林化工学院.doc
- 煤港斗轮取料机电气控制系统设计_毕业设计 燕山大学.doc
- 煤矿常闭互锁风门组自动控制系统毕业论文 中国矿业大学.doc
- 某公司速冻食品出口生产基地建设项目可行性研究报告(精编).doc
- 考古学家考古发掘试题及解析.doc
- 2026年注册地籍测绘师考试题库(附答案和详细解析)(0204).docx
- 2025至2030中国针织行业市场深度调研及前景趋势与投资报告.docx
- 教育培训机构师资培养计划.docx
- 2026年安全生产知识竞赛必背60个重点知识点汇编.pdf
- 职场“内耗”的“自我摆脱”方法.docx
- 咖啡店开业活动策划.docx
- 伊春市汤原县2025-2026学年第二学期二年级语文期末考试卷部编版含答案.docx
- 2026年残障服务协调员考试题库(附答案和详细解析)(0113).docx
- 2025至2030中国自动乳腺超声系统(ABUS)行业调研及市场前景预测评估报告.docx
原创力文档

文档评论(0)