- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 1
Web数据库当前研究与应用现状概述
摘要:Web数据库是当前研究是热点方向之一,其应用的范围和程度也相当广泛,几乎涉及到各个行业。本文对当前Web数据库的研究与应用做一个梳理,以得到一个较清楚的认识。
关键词:Web数据库;研究;应用
中图分类号:TP311文献标识码:A文章编号:1007-9599(2012)07-0000-02
随着Internet的飞速发展,网上的数据资源空前丰富,数据的传播速度也在迅速增加。“Web数据挖掘是从WWW资源上抽取信息(或知识)的过程,Web是对WWW资源中蕴涵的、未知的、有潜在应用价值的模式的提取。它反复使用多种数据挖掘算法从观测数据中确定模式或合理模型,是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域。”[1]基于此,本文从Web数据库的研究与应用做一下概述。
一、关于Web数据库的研究
对于Web数据库的研究,学术界主要集中在对Web数据的挖掘方面,包括Web数据挖掘的内容、Web数据挖掘的结构和Web数据挖掘的使用。
(一)Web数据挖掘的内容
“Web挖掘就是运用数据挖掘技术在Web文档与服务器自动发现并提取有用信息。它是数据库、信息检索、人工智能、机器学习与自然语言处理等几个相关研究领域的聚合。”[2]
在内容挖掘上,它是对大量文档的集合进行总结、分类和分析并获取有用信息,它实际上是将数据挖掘技术应用在计算机网络上进行信息处理。对象主要是针对网上的各种非结构化数据,如文本数据、音频数据、图形数据等多媒体数据进行处理,包括文本信息和多媒体信息的挖掘。目前,对Web数据挖掘的内容一般有两个观点,一是从资源(IR)查找来看,“Web内容挖掘的任务是从用户的角度出发,怎样提高信息质量和帮助用户过滤信息。”二是从数据库(DB)来看,“Web内容挖掘的任务主要是试图对Web上的数据进行集成、建模,以支持对Web数据的复杂查询。”
在结构挖掘上,Web结构挖掘通过分析一个网页的链接和被链接的数量以及对象建立Web自身的链接结构模式,以从WWW的组织结构和链接关系中找到有用的信息,并推到出知识。它不仅包括在页面间采用一种超链接的方法,从一个页面指向另一个页面的超链接,也包括以HTML或XML表示的树形结构,文档URL的目录路径结构,WWW中含有丰富的信息,用户需要根据自己的需要去寻找相关信息。Web结构挖掘有着广泛的应用,主要有:指导采集网页、聚类检索结果、识别社区团体、自动分类资源等。
在使用挖掘上,它用于预测用户在Web上交互式信息查询中的行为,可以帮助用户更有效地找到信息,还可以帮助优化资源的分配。根据应用的不同,可以将Web使用挖掘分为两种主要倾向,即:一般的访问模式跟踪与定制的访问模式跟踪。“一般的访问模式跟踪通过分析Web访问日志来理解访问模式与倾向,利用这些分析可以清楚地给出较好的Web结构及资源提供者的分组情况。”“定制使用跟踪可以分析个人的嗜好与倾向,在显示的信息,网站的结构与资源的格式等方面进行动态地定制以为每个用户构建符合其个人特色的Web站点。”挖掘过程分为四个阶段:数据采集,预处理,模式发现,模式分析。“根据对数据源的不同处理方法,Web用法挖掘可以分为两类,一类是将Web使用记录的数据转换并传递进传统的关系表里,再使用数据挖掘算法对关系表中的数据进行常规挖掘;另一类是将Web使用记录的数据直接预处理再进行挖掘。”
(二)Web数据挖掘的特点
半结构化特点:所谓半结构化是相对于结构化和非结构化而言的。半结构化数据模式有以下特征:
(1)先有数据,后有模式。
(2)半结构化数据的模式是用于描述数据的结构信息,而不是对数据结构进行强制性的约束。
(3)半结构化数据的模式是非精确的,它只可能描述数据的一部分结构也可能根据数据处理的不同阶段的视角不同而异。
(4)半结构化数据的模式可能规模很大,甚至超过源数据的规模,而且会由于数据的不断更新而处于动态变化过程中。[3]
二、关于Web数据库的应用
Web数据的应用范围非常广泛,可以说渗透到了人们学习工作生活的各个角落,而且以此为基础,开发出了各种程序,大大提高了人们的工作效率,方便了人们的生活。本文以几个例子来简单阐述Web数据的应用情况:
(一)Web数据在网络教学中的应用
计算机应用到教学领域,使教学模式、教学思想、教学过程、教学方法、乃至教学的组织都发生了重大的变革。作为一种新的教学方式,计算机网络教学不受时空限制的,并且是交互式和图文并茂的,可以让学生更直观地理解和领会教学的内容,而且最大优势是可以实现远程教学。
首先,Web网络教学系统的结构框架和设计,以教学课件模型设计及环节的功
您可能关注的文档
- 《新闻记者》十年“十大假新闻”的消息来源使用手法分析.doc
- 《叶在山的那边》教学设计.doc
- 《义务教育历史课程标准》(2011年版)特点分析及教学评价建议.doc
- 《员工培训实施》教学改革初探.doc
- 《周易.蹇卦》卦名_卦爻辞及卦义的演变.doc
- 2型糖尿病下肢血管病变气阴两虚兼血瘀证患者细胞免疫状态观察.doc
- 10kV配电工程电缆施工的技术探讨.doc
- 10KV线路断线原因分析及应对措施概述.doc
- 30年来中国农业经济政策及其效果分析.doc
- 60%甲维.杀虫单WP防治纵卷叶螟的药效试验.doc
- 强化训练人教版九年级物理《内能的利用》专项练习试题(含答案及解析).docx
- 强化训练人教版九年级物理《内能的利用》专项训练练习题(含答案详解).docx
- 强化训练人教版九年级物理《内能的利用》专项练习试题(含解析).docx
- 强化训练人教版九年级物理《内能的利用》专题攻克试题(详解版).docx
- 安徽天一大联考2025-2026学年高一上学期10月调研考试化学试题及答案.pdf
- 强化训练人教版九年级物理《内能的利用》专项练习试卷(含答案解析).docx
- 2025年重要!!电缆标注识读.pdf
- 强化训练人教版九年级物理《内能的利用》专项测试试题(含答案解析版).docx
- 强化训练人教版九年级物理《内能的利用》专项测试试题(含解析).docx
- 强化训练人教版九年级物理《内能的利用》专项测试试题(含解析).docx
文档评论(0)