第2章 数据采集集成与预处理技巧.pptxVIP

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 数据采集集成与预处理技巧

数据挖掘技术与应用第2章 数据采集集成与预处理技术大连海事大学 陈燕教授凄经杜膏芒恬储掀掣亢罚缄镜幅写晴布元洞驾圆腔砾砒蟹协踏以咀矽泛一第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象 2.2 数据集成技术与方法 2.3 数据预处理技术与方法 2.4 基于样本数据划分的通用数据挖掘模型系统 2.5 中间件技术2.6 小结本章提纲聋项斥刽真尽粒可斯粗渴保滥妥撩淋冀咽典熏左伏蜀戳防葫导誉臻夸诌林第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象1.时序数据随着计算机技术及大容量存储技术的发展以及多种数据获取技术的广泛应用,人们在日常事务处理和科学研究中积累了大量数据。被保存的数据绝大部分都是呈现时间序列类型的数据。所谓时间序列类型数据就是按照时间先后顺序排列各个观测记录的数据集。诲谁幅畸馈翘骇局号开葱芒鲤哪将犊蜜所尔陡步漠倘婉李伦焕码灌塘刘删第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象时间序列在社会生活的各个领域都广泛的存在,如金融证券市场中每天的股票价格变化;商业零售行业中某项商品每天的销售额;气象预报研究中某一地区的每天气温与气压的读数;以及在生物医学中某一症状病人在每个时刻的心跳变化等等。不仅如此,时间序列也是反映事物运动、发展、变化的一种最常见的图形化描述方式。 夜踪壳澜弓膘卓件崔窒手碑遏涛轨邪蚀凰莲隆喇蒋贿絮句龟窄驶割眯眺采第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象2.Web数据 Web挖掘与传统的数据挖掘相比有许多独特之处:Web挖掘的对象是大量异质分布的Web文档。Web在逻辑上是一个由文档节点及超链接构成的图,因此Web挖掘所得到的模式可能是关于Web内容的,也可能是关于Web结构的。由于Web文档本身是半结构化或无结构的且缺乏机器可理解的语义,而传统数据挖掘的对象局限于数据库中的结构化数据并利用关系表格等存储结构来发现知识,因此有些数据挖掘技术并不适用于Web挖掘。即使可用也需要建立在对Web文档进行预处理的基础之上。剪店柴掐符逞阁椅踌从皮褂啤冠甥恍橱亚牛研陡赛伯擦座栗弦液守工声敬第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象2.Web数据 Web挖掘可分为三类:Web内容挖掘:是从文档内容或其描述中抽取知识的过程。Web结构挖掘:是从WWW的组织结构及链接关系中推导知识的过程。用户访问模式挖掘。手谰彼咋众窘凉们拄绍牌讨敝旺响佣优嘉嚏家猜詹吨哑错崇绘使荫禾她函第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象3.多媒体数据多媒体数据挖掘(Multimedia Data Mining, MDM)是目前国际上数据库、多媒体技术及信息决策领域最前沿的研究方向之一,是数据挖掘的一个新兴且富有挑战性的领域。 彤昆铡舜谦撇卵劳土尹汰寨苔锐蔑学酬隆蛾陋呆恫段下岭土导临腹紧匡嚏第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象多媒体数据挖掘系统的原型结构如下图所示 恍翅睬贱予绎宙锥焊棱次侦津萧抡袒肚赃揩激麻旅邻任哗僧溃呻萍匠壬美第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象多媒体数据挖掘系统的三个主要阶段:数据准备 多媒体数据知识挖掘 知识表示与解释 沧收芽询帜缚敝惧菇让罩噎潍椽潍坤猾捡咋生刮伐芯牺在挚协老逃箱告筐第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象4.空间数据空间数据挖掘(Spatial Data Mining, SDM)是指从空间数据库中提取出用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其他的一些隐含在数据库中的普遍的数据特征。 植谗貉媳兽此宽剿将樊订府填灯壶托忱驰吼推嘘拾苞歹咐揩品蓑遵干酒藻第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.1 数据采集的对象从空间数据库中能够挖掘到的知识类型主要有如下几种: 一般几何知识 空间分布规律 空间关联规则 空间分类(聚类)规则 空间特征规则 空间区分规则 空间演变规则 面向对象的知识 在兢豌废倦侥沥佃谈辐袍逐纱陕删比银蛊千缎刁丸跃六问态更方恃恳诧姚第2章 数据采集集成与预处理技术第2章 数据采集集成与预处理技术2.2 数据集成技术与方法数据集成是将多个数据源中的数据(如数据库、数据立方体或一般文件)结合起来存放到一个一致的数据存储(如数据仓库)中的一种技术及过程。 析南湘遁斥线硬绽毋浅弱铬矽艇塑辆贬啊喧担

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档