文本数据挖掘技术在Web知识库中的应用研究.pdfVIP

文本数据挖掘技术在Web知识库中的应用研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科 技 通 报 Vo1.28 No.12 第28卷 第 12期 2012年 12月 BULLETIN OFSCIENCEAND TECHNOLOGY Dec.2012 文本数据挖掘技术在Web知识库中的应用研究 蔡立斌 (九江学院信息技术中心,江西 九江 332005) 摘 要:介绍了文本数据挖掘和知识提取的基本理论,然后分析了网络信息的检索与挖掘的特征,特别 是文本挖掘、Web数据挖掘和基于内容数据挖掘与之相关联的系列问题。在此基础上,分析了web知识 库的设计、建立、文本数据挖掘和知识发现所需的理论和技术,对Web知识库系统的架构和功能模块进 行分析和设计,建立了基于文本数据挖掘的Web网络知识库的模型。 关键词:数据挖掘;KDD;OWL 中图分类号 :TP311.13 文献标识码:A 文章编号:1001—7119(2012)12—0054—03 TheAppliedResearchofTextData M iningTechnologyintheW ebKnowledgeBase C Libin (InformationTechnologyCenterofJiujiangUniversity,Jiujiang332005,China) Abstract:Thisarticlefirstbrieflydescribesthebasictheoryoftextdataminingandknowledgeextraction andthenana— lyzesthenetworkinfomr ationretrievalandminingoffeature,especiallyWebtextmining,datamininganddatamining basedoncontentassociatedwiththeseriesofproblems.Onthisbasis,weanalyzedtheoryandtechnologythattheWeb knowledgebasedesign,build,textdataminingandknowledgediscovery arerequired,theWebknowledgebasesystem structureandfunctionmoduleisanalyzedanddesigned,basedontextdataminingWebnetworkknowledgebasemode1. Keywor~:datamining;KDD(knowledgediscoveryindatabases);OW1.(Webontoloyg language) 随着数字化信息的不断增长,互联网信息中99% 事先未知的、可理解的、最终可用的信息或知识的计算 的可分析信息是以文本形式存在。Web网页总量已达 机处理技术 。顾名思义,文本数据挖掘是从文本中进 数百亿,每天新增网页数千万,截至2011年12月底 ,中 行数据挖掘。文本挖掘是从数据挖掘发展而来,主要是 国互联网网页数量为866亿(中国互联网络信息中心统 从未经处理的文本中提取出未知的知识。但与传统的 计)。目前数据挖掘的绝大部分工作所涉及的是结构化 数据挖掘相比,文本挖掘有其独特之处,主要表现在文 数据库,很少有处理Web上的异质、非结构化信息的T 档本身是半结构化或非结构化的,无确定形式并且缺 作 [11。Web文本数据的挖掘作为数据挖掘的一个新主 乏机器可理解的语义,而数据挖掘的对象以数据库中 题,引起了人们极大兴趣。Web挖掘系统的开发对其研 的结构化数据为主,并利用关系表等存储结构来发现 究也将起到很大推进作用[21。所以,如何建立

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档