- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘与知识发现 - 数据挖掘实验室 datamining lab
作业 数据挖掘研究的问题有哪些 请举例阐述一个你身边的数据挖掘问题 数据挖掘与知识发现 林琛、邹权 博士、助理教授 课程信息 时间 理论课:周一5-6 实验课:双周周一1-4 地点 理论课:海韵教学楼102 实验课:海韵教学楼502、505 课程内容 直观的了解什么是数据挖掘 数据挖掘的典型任务 数据挖掘的经典算法 亲身体会数据挖掘的乐趣 完成一个课程项目, 和同班同学竞赛 有兴趣的同学可以进一步选择一个开放课题作为毕设 考核方式 开卷、最后一次课 全勤@点名 = 及格 高分 = 出色的项目成绩 完成一个课程项目 知识发现? 某种规律、模式、规则、知识 和应用有关 关联规则 内在次序 分属类别 序列模式 商品促销 微博推荐关注 在你常用的微博上,希望被提供什么样的服务? 图像识别 DNA序列 海量 我们处理的数据通常是海量的 Google处理的互联网网页:万亿 Twitter的用户数:亿 大型数据库:TB级别 时空效率 内存有限 处理时间 数据类型 数据库记录 Xml 网页 文本 多媒体 序列数据 数据库记录 特点: 格式规范 结构化 经过人工整理-含义明确 Xml,html 有一定的格式 有一定的结构 含义比较明确 纯文本,多媒体 姓名 曹雪芹 性别 男 出生 1715 职业 小说家 字 梦阮 作品 红楼梦 居住地 北京 图像 图.jpg 没有格式要求 内在结构不明确 含义需要理解 其他 图像、音乐、时序、空间数据 有自己的特点 结论:数据挖掘研究什么 从各种类型的海量数据中 根据应用目标 高效的挖掘出 有价值的模式、规律、知识等 数据挖掘的典型任务 关联规则挖掘 分类 聚类 回归/数值拟合 可以互相转换 关联规则挖掘 最小支持度 50% 最小置信度 50% 对规则A ? C,其支持度 置信度 分类 聚类 回归/数值拟合 互相转换 以推荐系统为例 假设你构建了一个电子商务网站,有很多的注册用户在网站上浏览商品、购买、并评分 你如何用数据挖掘的方法向每一个用户推荐他/她可能感兴趣并购买的商品呢? 课程项目,会给一个数据集、一个目标,没有答案,提交系统给出排名 * 假设你是一个超市经理,你有一段时间内每天每位顾客的购物记录,想想看,你希望利用这个数据发现什么有价值的信息? 关联规则比较典型的案例是“尿布与啤酒”的故事。在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,超市也因此发现了一个规律,在购买婴儿尿布的年轻父亲们中,有30%~40%的人同时要买一些啤酒。超市随后调整了货架的摆放,把尿布和啤酒放在一起,明显增加了销售额。同样的,我们还可以根据关联规则在商品销售方面做各种促销活动。 * 在你常用的微博上,你希望被提供什么样的服务? *
文档评论(0)