- 5
- 0
- 约6.67万字
- 约 6页
- 2016-12-22 发布于贵州
- 举报
一种文本分类数据挖掘的技术
来源:网店装修
摘要 挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,本文介绍了一种文本数据挖掘方法。并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性。 关键词 文本挖掘;文本分类;数据挖掘;VSM
本文首先讨论了文本挖掘技术的定义、功能、分类等问题,接着重点研究了文本分类的关键理论问题,包括分词、特征提取、特征匹配等方面,并简述了我们开发的一个简单的文本分类系统的实验情况,最后是结束语。
1文本挖掘简介 1.1 文本挖掘的定义
文本挖掘作为数据挖掘的一个新主题,引起了人们的极大兴趣,同时,它也是一个富于争议的研究方向,目前其定义尚无统一的结论,需要国内外学者开展更多的研究以便进行精确地定义。类似于我们熟知的数据挖掘定义,我们对文本挖掘作如下定义。 定义1:文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的信息或知识的过程。
直观的说,当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称为文本挖掘。文[1]已对Web挖掘与信息检索进行了比较研究,在此,我们不再详细讨论文本挖掘与信息检索的关系,我们认为随着文本挖掘技术研究的发展,将之应用到信息检索领域,必将能进一步提高信息检索的精度和效率。 1.2 文本挖掘的分类
文本挖掘
您可能关注的文档
最近下载
- 2024年成都铁路局招聘全日制普通高校毕业生笔试公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 《海南大学学报(人文社会科学版)》创刊40周年刊文量化分析.pdf VIP
- 家用电风扇逻辑电路设计报告.pdf VIP
- T_CDAIA 0008—2024(电动汽车有序充电和V2G双向互动技术规范).pdf VIP
- 2025年中级注册安全工程师《安全生产法律法规》真题及答案解析(完整版).docx VIP
- 大庆油田套损情况及钻井工程质量分析.pdf VIP
- 【2025年】保安员考试题库附完整答案.docx
- 问题清单整改清单(纪检组长).pdf VIP
- 2025年北京铁路局招聘笔试备考题库及答案解析.docx VIP
- NB_SH_T 6027-2021CN 润滑脂分油的测定 压力过滤法.docx
原创力文档

文档评论(0)