- 14
- 0
- 约8.83千字
- 约 7页
- 2017-03-29 发布于湖北
- 举报
文本数据挖掘及其应用
摘要:随着Internet上文档信息的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术。本文首先对文本挖掘进行了概述包括文本挖掘的研究现状、主要内容、相关技术以及热点难点进行了探讨,然后通过两个例子简单地说明了文本挖掘的应用问题。
关键词:文本挖掘 研究现状 相关技术 应用
1 引言
随着科技的发展和网络的普及,人们可获得的数据量越来越多,这些数据多数是以文本形式存在的。而这些文本数据大多是比较繁杂的,这就导致了数据量大但信息却比较匮乏的状况。如何从这些繁杂的文本数据中获得有用的信息越来越受到人们的关注。“在文本文档中发现有意义或有用的模式的过程n1的文本挖掘技术为解决这一问题提供了一个有效的途径。而文本分类技术是文本挖掘技术的一个重要分支,是有效处理和组织错综复杂的文本数据的关键技术,能够有效的帮助人们组织和分流信息。
2 文本挖掘概述
2.1文本挖掘介绍
数据挖掘技术本身就是当前数据技术发展的新领域,文本挖掘则发展历史更短。传统的信息检索技术对于海量数据的处理并不尽如人意,文本挖掘便日益重要起来,可见文本挖掘技术是从信息抽取以及相关技术领域中慢慢演化而成的。
1)文本挖掘的定义
文本挖掘作为数据挖掘的一个新主题 引起了人们的极大兴趣,同时它也是一个富于争议的研究方向目前其定义尚无统一的结论需要国内外学者开展更多的研究以进行精确的定义类似于我们
您可能关注的文档
- 数学应用题解题方法教材.doc
- 数字B超诊断系统结构文献综述教材.doc
- 数字存储示波器_杜喆&陈旭&张宏广 (自动保存的)幻灯片.docx
- 数字电路测试题幻灯片.docx
- 数字电路及其应用复习资料教材.doc
- 数字化井场设备调试教材.doc
- 数字化口腔设备简本解读.ppt
- 数字化医疗仪器解读.ppt
- 数字化语音存储与回放系统幻灯片.docx
- 数字集成电路的分类教材.doc
- 2026年航空货运量与库存分析报告.docx
- CN120278959A 一种火电厂除铁器节能控制方法及设备 (华能鹤岗发电有限公司).pdf
- 2026年医药行业研发趋势与市场分析报告.docx
- 2026年教育信息化行业发展与应用报告.docx
- 2026广东珠海金湾区第一小学代产假教师招聘1人考试模拟试题及答案解析.docx
- 农房节能改造工程监理单位工程竣工质量评估报告.docx
- 1997年四川高考理科数学真题及答案(OCR).pdf
- 2026年云计算服务市场发展与竞争格局报告.docx
- 黑河市2026国家开放大学工商管理_期末考试提分复习题(含答案).docx
- 2026年汽车自动驾驶技术发展趋势报告.docx
原创力文档

文档评论(0)