文本挖掘和Web挖掘.pptVIP

下载本文档

98
0
约小于1千字
约 12页
2018-10-25 发布于福建
举报

文本挖掘和Web挖掘.ppt

文本挖掘和Web挖掘

文本挖掘与Web挖掘文本挖掘的基本概念文本挖掘时从大量数据中提取以前未知的、有用的、可理解的、可操作的知识的过程。它除了从文本中提取关键字外，还要提取事实、作者的意图、期望和主张等。这些知识对许多应用如市场营销、趋势分析等都很有用。相对于数据挖掘，文本挖掘的对象是半结构化或非结构化的。文本挖掘的主要任务短语提取。概念提取可视化显示和导航文本挖掘和数据挖掘的区别数据挖掘数字表示的数据关系数据库预测以后决策树、神经网络等 1994年起文本挖掘无结构或半结构开放的文本提取概念提取短语，关联分析、聚类、分类 2000年起文本特征的表示文本特征的提取一般特征：人名、组织名数字特征：日期、时间、货币、数字文本挖掘关键字检索相似检索词语关联分析文本聚类和分类自然语言处理关联分析首先对文本进行词根处理，去除非用词等预处理，然后调用关联挖掘算法。在文本数据库中，每一个文本被视为一个事务，文本中的关键词组可视为事务中的一组事务项。这样文本数据库中关键词关联挖掘问题就变成事务数据库中事务项的关联挖掘。文本聚类层次聚类法平面划分法文本分类用信息检索技术提取关键词和词组生成关键词和词组的概念层次关联挖掘用于发现关联词。区分一类文本与另一类文本。 Web挖掘简介信息庞大信

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

文本挖掘和Web挖掘.pptVIP