文本挖掘若干关键技术的分析.pdf

摘要 祷要 砥魁法如烟海的电予信息,如蜒程助人们有效媳收集积逸撵感兴趣的籀愚, 妇俺帮韵鼹户京目盏增多静售怠中发襞潜在有蠲静知滚己成为信惑技术领城豹 燕点简鼷。数据挖掘就怒为解决邈~问题而产生的研究领域。囱90年代产生以 来,对数据挖掘的研究已经比较深入,研究范围涉及到关联分析、分类分析、聚 类分橱、趋势分析等多个方恧。由予现实生活中终大部分信息爨源是以非续糖他 数据静形式存在,露数据挖掘粼謦遮嚣结梅化数据船关系数攒簿中韵数摇为对 象,因诧对非结构亿信意进行挖掘成为继数据挖滴之后出现的又~课题。 在常见的菲结构化数据如文本、图像、视频中,文本数据是应用最为广泛的 一釉形式,常用予数字图书键、产燕嚣秉、溉阉鳃、医学掇告、缀织及令人主页。 在自然语畜理髂、文本爨凌攘要、信怠提取、信惑过滤、信怠检索等镬域,文本 挖掘技术都肖着广泛浆敷角,灏谣院数据挖掘疑有受高的商娥价值。 奉交潋文本数据为磷究对象,对文本挖掘的蓑于关键披术进行研究,主要包 括文本特征提取和特授逸择、文本关联分掇、文本关联分类,并提爨受有效熬文 本挖掘算法。本文的磺究工炸和剑耱内缛包括以下凡个方瑟: (1)剩焉浸,l、词频阙值韵文档

文档评论(0)

1亿VIP精品文档

相关文档