旅游电子商务教学课件:项目八:旅游电子商务数据挖掘(授课).pptVIP

旅游电子商务教学课件:项目八:旅游电子商务数据挖掘(授课).ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
课堂讨论 以4人为一个小组,查阅大数据与数据挖掘在旅游业应用的案例,分组讨论:什么是数据挖掘?数据挖掘在电子商务业务上有哪些成功的案例?旅游业是否也需要进行旅游数据挖掘? 虽然有些数据挖掘技术非常新颖并且看上去非常酷,但是数据挖掘本身并不是一种新的技术,自从世界上第一台计算机发明并投入实用以来,各行各业的人们就一起通过计算机进行数据分析,并把结果应用到各自的领域。在计算机发明之前的数个世纪里,人们在没有计算机的情况下,同样分析数据,只不过速度要慢上许多。Gordon S.Linoff对数据挖掘的定义是:数据挖掘是一项分析大量数据以发现有意义的模式和规则的业务流程。 一、什么是数据挖掘 自动预测趋势和行为,数据挖掘自动在大型数据库中寻找预测性信息,以往需要进行大量手工分析的问题如今可以迅速直接由数据本身得出结论。 关联分析,数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。 聚类,数据库中的记录可被划分为一系列有意义的子集,即聚类。 二、数据挖掘功能 概念描述,就是对某类对象的内涵进行描述,并概括这类对象的有关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象的共同特征,后者描述不同类对象之间的区别。 偏差检测,数据库中的数据常有一些异常记录,从数据库中检测这些偏差很有意义。 二、数据挖掘功能 三、数据挖掘技术包括 关联分析 主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。其主要依据是事件发生的概率和条件概率应该符合一定的统计意义。 序列分析 序列分析技术主要用于发现一定时间间隔内接连发生的事件。这些事件构成一个序列,发现的序列应该具有普遍意义。 三、数据挖掘技术包括 分类分析 分类分析通过分析具有类别的样本的特点,得到决定样本属于各种类别的规则或方法。主要方法有基于统计学的贝叶斯方法、神经网络方法、决策树方法及支持向量机。 聚类分析 聚类分析是根据物以类聚的原理,将本身没有类别的样本聚集成不同的组,并且对每一个这样的组进行描述的过程。其主要依据是聚到同一个组中的样本应该彼此相似,而属于不同组的样本应该足够不相似。 三、数据挖掘技术包括 预测 预测与分类类似,但预测是根据样本的已知特征估算某个连续类型的变量的取值的过程,而分类则只是用于判别样本所属的离散类别而已。预测常用的技术是回归分析。 时间序列 分析时间序列分析的是随时间而变化的事件序列,目的是预测未来发展趋势,或者寻找相似发展模式或者是发现周期性发展规律。 四、机器学习与数据挖掘 机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它专门研究计算机是怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。 数据挖掘是从海量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘中用到了大量的机器学习界提供的数据分析技术和数据库界提供的数据管理技术。 四、机器学习与数据挖掘 Tom Mitchell在1997年出版的Machine Learing一书中指出,从数据分析的角度来看,数据挖掘与机器学习有很多相似之处,但不同之处也十分明显,例如,数据挖掘并没有机器学习中所包含的探索人的学习机制这一科学发现任务,数据挖掘中的数据分析是针对海量数据进行的,等等。从某种意义上说,机器学习的科学成分更重一些,而数据挖掘的技术成分更重一些。 任务拓展 咨询一下你在旅行社、酒店、景区等旅游企业实习或工作的师兄弟师姐,了解一下,他们的公司有没有采用数据挖掘技术为公司的业务开展提供数据支持。 任务二:电商数据挖掘工具 任务导入:张大方是朝阳旅行社的电商部经理,近日接到公司的通知,要在他的部门里成立一个旅游数据挖掘的项目小组,目的是分析商业数据,为公司的决策和业务开展提供数据支持。张大方是学旅游管理的,学过Visual Basic和SPSS,对数据统计也有些了解,但对数据挖掘还是有些陌生,作为部门负责人,当然要对这个数据挖掘小组的业务有深层次的了解,所以他决定要好好恶补一下。他发现部门实习生手中有本《旅游电子商务》,其中有一部分是对数据挖掘的介绍,倒也通俗易懂,于是,用了三天的时间阅读了数据挖掘的内容,学习过后,心中对成立这一项目小组有了底。 任务二:电商数据挖掘工具 以4人为一个小组,分组讨论三种以上的大数据分析工具,你们认为哪种工具比较适合自己,为什么? 一、常见数据挖掘工具 Rapid Miner,是一个用于机器学习和数据挖掘实验的环境,用于研究和实际的数据挖掘任务。毫无疑问,这是世界领先的数据挖掘

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档