- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2007.3荆楚理工学院●复制工具SQLSERVER2000的复制工具能够分发数据并协调不同的数据库之间的更新操作,尤其是复制工具能够有效地把中央数据仓库中的数据分发到数据集市中。9.1数据仓库2007.3荆楚理工学院一、数据挖掘技术概述数据挖掘是一门综合性的技术,涉及到很多学科---数据库、人工智能和数理统计等等。目前其主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现以及网上数据挖掘等。9.2数据挖掘2007.3荆楚理工学院数据挖掘与数据仓库技术有着密切的关系。见图10.2.19.2数据挖掘2007.3荆楚理工学院数据挖掘库可能是你的数据仓库的一个逻辑上的子集,而不一定非得是物理上单独的数据库。但如果你的数据仓库的计算资源已经很紧张,那你最好还是建立一个单独的数据挖掘库。9.2数据挖掘2007.3荆楚理工学院数据挖掘和OLAP的不同之处:●OLAP是决策支持领域的一部分。OLAP分析过程在本质上是一个演绎推理的过程。但是如果分析的变量达到几十或上百个,那么再用OLAP手动分析验证这些假设将是一件非常困难和痛苦的事情。数据挖掘与OLAP不同的地方是,数据挖掘不是用于验证某个假定的模式(模型)的正确性,而是在数据库中自己寻找模型。他在本质上是一个归纳的过程。9.2数据挖掘2007.3荆楚理工学院●数据挖掘和OLAP具有一定的互补性。在利用数据挖掘出来的结论采取行动之前,你也许要验证一下如果采取这样的行动会给公司带来什么样的影响,那么OLAP工具能回答你的这些问题。9.2数据挖掘2007.3荆楚理工学院二、数据挖掘(DATAMINING)的定义数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。9.2数据挖掘2007.3荆楚理工学院以上定义包括好几层含义:●数据源必须是真实的、大量的、含噪声的;●发现的是用户感兴趣的知识;●发现的知识要可接受、可理解、可运用;●并不要求发现放之四海皆准的知识,仅支持特定的发现问题。9.2数据挖掘2007.3荆楚理工学院数据挖掘的目标是从数据中找到感兴趣的模式,用这些模式来决定商业策略或发现不正常的情况。数据挖掘工具在海量数据上应用了统计技术来查找这些模式。9.2数据挖掘2007.3荆楚理工学院三、数据挖掘的过程模型及常用技术以TWOCROWS公司的数据挖掘过程模型为例进行讨论。基本数据挖掘步骤包括:定义商业问题、建立数据挖掘模型、分析数据、准备数据、建立模型、评价模型和实施。9.2数据挖掘2007.3荆楚理工学院数据挖掘常用技术包括:①人工神经网络,即仿照生理神经网络结构的非线形预测模型,通过学习进行模式识别。②决策树,它代表着决策集的树形结构。③遗传算法,基于进化理论,并采用遗传结合、遗传变异、以及自然选择等设计方法的优化技术。④近邻算法,将数据集合中每一个记录进行分类的方法。⑤规则推导,从统计意义上对数据中的如果-那么规则进行寻找和推导。9.2数据挖掘2007.3荆楚理工学院四、目前数据挖掘的主要应用●网站的数据挖掘●生物信息或基因的数据挖掘●文本的数据挖掘9.2数据挖掘2007.3荆楚理工学院面向对象的数据库技术可以直接处理一些复杂的对象、描述这些对象的复杂特征,因此,它可以满足当前一些新的数据库应用的需要。这些新的应用中的数据大部分是不能利用关系模型和实体-联系模型来充分加以描绘的。这些应用包括:9.3面向对象的数据库技术2007.3荆楚理工学院●计算机辅助设计(CAD)CAD数据库存储了与一个工程设计相关的数据,包括所设计物品的各个组件、这些组件之间的相互关系等。●计算机辅助软件工程(CASE)CASE数据库存储了用于辅助软件开发者的一些数据。这些数据包括源代码、软件模块间的依赖关系、变量的定义和使用,以及软件系统的开发历史等。9.3面向对象的数据库技术2007.3荆楚理工学院●多媒体数据库多媒体数据库包含图像数据、空间数据、音频数据、视频数据等等。这种类型的数据主要用于存储照片和地理数据,以及语音邮件系统、图形系统和视频点播系统等。●办公自动化系统办公自动化包括基于工作台的文档的生成和检索工具、维护日程安排的工具等。办公自动化数据库必须允许对日程、文档和文档内容进行查询。9.3面向对象的数据库技术2007.3荆楚理工学院●超文本
您可能关注的文档
- 组网技术与配置(第2版).ppt
- 模块八发动机的总装与调试.ppt
- 怎样从外在形式上把握材料作文的审题立意.ppt
- 《YY/T 0337-2025麻醉和呼吸设备 气管插管和接头》.pdf
- 中国行业标准 YY/T 0337-2025麻醉和呼吸设备 气管插管和接头.pdf
- YY/T 0337-2025麻醉和呼吸设备 气管插管和接头.pdf
- 湖南省长沙市第一中学2025-2026学年高三上学期月考(四)(11月)语文试题+答案.docx
- 2025-2026学年上海嘉定一中高一上学期数学期中试卷及答案(2025.11).pdf
- 江苏省常州市2025-2026学年高三上学期11月期中考试地理试题(含答案).docx
- 浙江省A9协作体2025-2026学年高一上学期11月期中英语试题含解析.docx
原创力文档


文档评论(0)