数据挖掘概述与关联规则挖掘-北京大学计算机科学技术研究所语言.PDF

数据挖掘概述与关联规则挖掘-北京大学计算机科学技术研究所语言.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘概述与关联规则挖掘-北京大学计算机科学技术研究所语言

《《《《互联网数据挖掘互联网数据挖掘互联网数据挖掘互联网数据挖掘》》》》本科生课程本科生课程本科生课程本科生课程 数据挖掘基础(一):数据挖掘基础(一): 数据挖掘概述与关联规则挖掘数据挖掘概述与关联规则挖掘数据挖掘概述与关联规则挖掘数据挖掘概述与关联规则挖掘 ((附项目作业布置附项目作业布置)) 万小军万小军 北京大学语言计算与互联网挖掘组北京大学语言计算与互联网挖掘组北京大学语言计算与互联网挖掘组北京大学语言计算与互联网挖掘组 /lcwm/lcwm 年1010月月1616日日 数据挖掘概述数据挖掘概述 2 日常生活中人的日常生活中人的 “挖掘挖掘”行为行为 股民炒股股民炒股 :预测股票涨跌预测股票涨跌 3 日常生活中人的日常生活中人的 “挖掘挖掘”行为行为 市民买房市民买房 :预测房价涨跌预测房价涨跌 4 日常生活中人的日常生活中人的 “挖掘挖掘”行为行为 图书馆员对图书的分类图书馆员对图书的分类 5 日常生活中人的日常生活中人的 “挖掘挖掘”行为行为 为朋友推荐为朋友推荐/介绍男介绍男/女朋友女朋友 6 日常生活中人的日常生活中人的 “挖掘挖掘”行为行为 老板开设餐厅对营业地点的选择老板开设餐厅对营业地点的选择 7 数据量剧增数据量剧增 ,,人无法应对人无法应对 ,,需需 要借助机器自动挖掘 问题:人机挖掘各自的优劣? 8 为什么要进行数据挖掘为什么要进行数据挖掘 商业领域商业领域 积累了大量商业数据 • Web数据,电商数据 • 银行交易数据 • … 计算机越来越便宜,也更强大 商业竞争压力很大商业竞争压力很大 • 需要为客户提供更好的、个性化的服务 9 为什么要进行数据挖掘为什么要进行数据挖掘 科学领域科学领域 积累了大量科研数据 • 卫星遥感数据 • 望远镜扫描太空数据 • 基因数据基因数据 • 科学模拟生成数据 • … 传统技术无法应对这些数据 数据挖掘技术能够帮助科学家数据挖掘技术能够帮助科学家 • 数据分类、分块 • 成因假设检验成因假设检验 10 什么是数据挖掘什么是数据挖掘 从数据中提取有用的模式与知识从数据中提取有用的模式与知识 隐式的、之前未知的 数据包括:数据库、文本、网页、图像、视频等 11 什么是数据挖掘什么是数据挖掘 什么不是数据挖 什么是数据挖掘 掘? ? 从电话目录里查 某些姓名在特定 阅电话号码 地点更普及 (O’Brien, 查询搜索引擎, O’Reilly…in 找到相关信息 BBostton area))

文档评论(0)

zhuwo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档