- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索数据挖掘.pdf
信息检索与数据挖掘信息检索与数据挖掘 11
信息检索与数据挖掘
第1章 绪论
信息检索与数据挖掘 2
提纲
1.1 信息检索的由来和这门课的意义
1.2 信息检索的历史和发展
1.3 信息检索与数据挖掘等其他学科的关系
1.4 信息检索的基本概念
1.5 课程要求和说明
信息检索与数据挖掘 3
提纲
1.1 信息检索的由来和这门课的意义
1.1.1 信息过载
1.1.2 信息检索的定义
1.1.3 数据挖掘的定义
1.1.4 本课程的意义
1.2 信息检索的历史和发展
1.3 信息检索与数据挖掘等其他学科的关系
1.4 信息检索的基本概念
1.5 课程要求和说明
信息检索与数据挖掘 4
信息检索的由来
为什么需要信息检索?
什么是信息检索?
什么是数据挖掘?
数据挖掘与信息检索有什么关系?
信息检索与数据挖掘 5
1.1.1 信息过载
•数据爆炸性的增长,而人的处理能力有限
• 网站
6.34亿 (2012年 5.55亿(2011年 2.55亿(2010年 Internet上网站
底) 底) 底) 总数
5100万 2012年新增网站数量
8780万 Tumblr博客的数量
5940万 全球WordPress网站的数量
35% 2012年网页平均变大35%
4% 2012年网页平均加载速度减慢4%
信息检索与数据挖掘 6
1.1.1 信息过载
•数据爆炸性的增长,而人的处理能力有限
• Web服务器
6.7% 2012年使用Apache服务网站的数量下降了6.7%
32.4% 2012年使用IIS服务网站的数量增长了32.4%
36.4% 2012年使用NGINX服务网站的数量增长了36.4%
15.9% 2012年使用Google服务网站的数量增长了15.9%
2012年12月Web服务器所占的市场份
额比例图
信息检索与数据挖掘 7
1.1.1 信息过载
•数据爆炸性的增长,而人的处理能力有限
• 视频
48 YouTube上每分钟上传视频的小时数
250万 被上传到YouTube新闻相关视频的小时数
883亿 Google sites (incl. YouTube)每月观看的视频数
2000万 Facebook 上每月上传的视频数
谷歌视频网站的独立访客访问数量,视频领域排名第一
10亿 短短五个月时间,鸟叔 Gangnam Style成
您可能关注的文档
最近下载
- 《射频识别技术原理与应用实战》全套教学课件.pptx
- 羊的同期发情技术.pptx VIP
- T-CAGHP 035—2018地质灾害排水治理工程设计规范(试行).docx VIP
- 第二批重点监管危险化学品名录.doc VIP
- 劳技课件教学课件.pptx VIP
- Unit 1 I love sports Part 1 (课件)2025-2026学年度外研版(三起)英语四年级上册.pptx VIP
- DBJ43_T393-2022:湖南省房屋建筑和市政工程消防质量控制技术标准.pdf VIP
- 2024年-2025年政工师(初级)理论考试题库及答案(综合题型).pdf VIP
- T∕ZZB 0900-2018 液晶调光玻璃团体标准.pdf VIP
- 朗朗阅读周周练四年级上册(1).pdf VIP
文档评论(0)