软件技术基础 教学课件 作者 张选芳 傅茂洺 王欣 计算机软件技术基础(邮电)4-4.pptVIP

软件技术基础 教学课件 作者 张选芳 傅茂洺 王欣 计算机软件技术基础(邮电)4-4.ppt

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
小结 需要复习的知识点 ?数据库设计 ?数据库新技术 ?多媒体数据库 ?分布式数据库 ?网络环境下的数据库体系 ?数据仓库 ?数据挖掘技术 (3) 分类分析 设有一个数据库和一组具有不同特征的类别(标记),该数据库中的每一个记录都赋予一个类别的标记,这样的数据库称为示例数据库或训练集。分类分析就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其它数据库中的记录进行分类。 举一个简单的例子,信用卡公司的数据库中保存着各持卡人的记录,公司根据信誉程度,已将持卡人记录分成三类:良好、一般、较差,并且类别标记已赋予各个记录。 分类分析就是分析该数据库的记录数据,对每个信誉等级做出准确描述或挖掘分类规则,如信誉良好的客户是指那些年收入在5万元以上,年龄在40 —50岁之间的人士,然后根据分类规则对其它相同属性的数据库记录进行分类。目前已有多种分类分析模型得到应用,其中几种典型模型是线性回归模型、决策树模型、基本规则模型和神经网络模型。 讲课内容、方法、步骤 (4) 聚类分析 聚类分析和分类分析是一个互逆的过程。例如在最初的分析中,分析人员根据以往的经验将要分析的数据进行标定,划分类别,然后用分类分析方法分析该数据集合,挖掘出每个类别的分类规则;接着用这些分类规则重新对这个集合(抛弃原来的划分结果)进行划分,以获得更好的分类结果。这样分析人员可以循环使用这两种分析方法直至得到满意的结果。 讲课内容、方法、步骤 4. 数据挖掘技术的应用范围 追根溯源,数据挖掘这个名字来源于它有点类似于在山脉中挖掘有价值的矿藏。在商业应用里,它就表现为在大型数据库里面搜索有价值的商业信息。这两种过程都需要对巨量的材料进行详细地过滤,并且需要智能且精确地定位潜在价值的所在。对于给定了大小的数据库,数据挖掘技术可以用它如下的超能力产生巨大的商业机会: (1) 自动趋势预测。 数据挖掘能自动在大型数据库里面找寻潜在的预测信息。传统上需要很多专家来进行分析的问题,现在可以快速而直接地从数据中间找到答案。一个典型的利用数据挖掘进行预测的例子就是目标营销。数据挖掘工具可以根据过去邮件推销中的大量数据找出其中最有可能对将来的邮件推销作出反应的客户。 (2) 自动探测以前未发现的模式。 数据挖掘工具扫描整个数据库并辨认出那些隐藏着的模式,比如通过分析零售数据来辨别出表面上看起来没联系的产品,实际上有很多情况下是一起被售出的情况。 讲课内容、方法、步骤 (3)数据挖掘技术可以让现有的软件和硬件更加自动化,并且可以在升级的或者新开发的平台上执行。 当数据挖掘工具运行于高性能的并行处理系统上的时候,它能在数分钟内分析一个超大型的数据库。这种更快的处理速度意味着用户有更多的机会来分析数据,让分析的结果更加准确可靠,并且易于理解。 此外,数据库可以由此拓展深度和广度。 ?深度上,允许有更多的列存在。 以往,在进行较复杂的数据分析时,专家们限于时间因素,不得不对参加运算的变量数量加以限制,但是那些被丢弃而没有参加运算的变量有可能包含着另一些不为人知的有用信息。现在,高性能的数据挖掘工具让用户对数据库能进行通盘的深度编历,并且任何可能参选的变量都被考虑进去,再不需要选择变量的子集来进行运算了。 ?广度上,允许有更多的行存在。 更大的样本让产生错误和变化的概率降低,这样用户就能更加精确地推导出一些虽小但颇为重要的结论。 讲课内容、方法、步骤 ?具体地说,建立数据库结构应包括以下几个方面: ?数据库模式与子模式,以及数据库空间的描述。 ?数据完整性的描述。 ?数据安全性描述。 ?数据库物理存储参数的描述。 (3) 数据库的试运行 当有部分数据装入数据库以后,就可以进入数据库的试运行阶段,数据库的试运行也称为联合调试。数据库的试运行对于系统设计的性能检测和评价是十分重要的,因为某些DBMS参数的最佳值只有在试运行中才能确定。 由于在数据库设计阶段,设计者对数据库的评价多是在简化了的环境条件下进行的,因此设计结果未必是最佳的。在试运行阶段,除了对应用程序做进一步的测试之外,重点执行对数据库的各种操作,实际测量系统的各种性能,检测是否达到设计要求。如果在数据库试运行时,所产生的实际结果不理想,则应回过头来修改物理结构,甚至修改逻辑结构。 讲课内容、方法、步骤 (9) 物主(owner):

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档