- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
课程网站-北京大学网络与信息系统研究所
网络信息体系结构Web-based Information Architecture 地点: 一教112 时间: 星期三,16:50-18:40 (另外每周安排一个小时的讨论,星期一17:50-18:40,地点待定) 教员: 李晓明 办公室: 理科一号楼1711 Email: lxm@ 电话: 前言 这门课的由来 基本内容 教材和参考资料 课程的管理要求 课程的由来 2003年1月,在印度遇到CMU的Jaime G. Carbonell教授,一起参加“中美百万册图书”项目讨论 Director of Language Technologies Institute /~jgc Web-based Information Architectures 从2001年开始发展“燕穹”的理念 从1999年开始接触“天网”搜索引擎 从1997年开始上“Internetics”课程 从1995年开始使用Web “中美百万册图书项目” 已经发展成“中美印” Raj Reddy, 1994 Turing Award Winner(人工智能) 让100万册书籍上网,为全人类“便捷”共享 有史以来,人类大约出版了100M本书,分散在各个图书馆和民间 北大图书馆约有500万册书 版权问题是该项目发展的一个制约因素 “中美百万册图书项目” 美国自然科学基金会 CMU Internet Archive, since 1997 Kahle Brewster (play the SEWM minutes and Brewster’s talk) 中国教育部 北大,清华,浙大,中科院研究生院… 1995年,开始接触Web 所受到的两次“技术文化”冲击 1982,电话;直到1987,也对Internet并没有什么感觉 1995,Web,世界好像变了 From “High Performance Computing and Communication” to “High Performance Networking and Computing”. From working on PCRC (Parallel Compiler and Runtime Consortium) to teaching web technologies based on the Internet/Web. 1997年,开始Internetics课程 一个人掌握了那些知识,就能称得上基本掌握了关于Web的技术知识? Buzzword driven approach … From Peking University to PKU-UWE to PKU-UWE-UnivSA Computer Science Internetics Internetics PKU-UWE: 1999 1999年,开始接触“天网”(play the story of Tianwang) 天网的背后 2001年,我们有了新的想法 “燕穹”,Web InfoMall 2003年,我们有更进一步的01/yc “中文数字财富大全库” China Digital Assets Library (CDAL) CDAL home page CDAL资源,2003年8月 乐曲,歌曲:20,000 电影,电视:2,000 图像,图片:60,000 书籍:10,000 网页:400,000,000 日志:30,000,000 可能性,放得下吗?我们得到最多的质疑 许多人(单位)都做这一项工作是不现实的(也没有必要;只要做一份,但开放) 但一个国家是完全有可能做的 10KB/网页,1MB/分钟mp3,100MB/小时视频,500KB/书,400KB/图片 10元/1GB,万元/1TB 估计,暂且到2010年 网页:20亿 ? 20TB 书籍:200万? 1TB 视频:100,000小时? 10TB 歌曲,乐曲:1000万分钟? 10TB 图像,图片:1000万幅? 4TB 总共45TB,45万元!(乐观派的结论?) 在100Mbps线路上,大约50天! 课程基本内容 Web,作为一个客观对象的若干已知性质(property) 用于发现Web性质的工具 收集Web信息的方法和技术 分析和处理Web信息的若干技术要点 Web信息查询服务 Web已有哪些性质? 网页的平均大小为10KB—15KB 网页的大小和内容大小的比约为3:1 服从“power law” 体现“小世界”(small world)现象 整体具有“蝴蝶领结”结构 网页的数量按几何级数增长 网页的平均生命周期约为1.4年,半衰期约为1年 网页的平均复制率约为4 查询日志具有很强的时间局部性 … Bow tie 发
您可能关注的文档
最近下载
- 意大利cemb(赛博)er60动平衡仪中文操作手册.pdf VIP
- 粮油供货保障方案.docx VIP
- 负压引流器产品技术要求标准2023版.pdf VIP
- 初中英语课外阅读黑布林版渔夫和他的灵魂中文译文.docx VIP
- Oasis montaj7.5 操作手册-Oasis montaj Mapping and Processing软件平台.pdf VIP
- 机械精度设计与检测技术基础第2版杨沿平第七章滚动轴承配合1课件教学.ppt VIP
- 云南省昆明市盘龙区2023-2024学年七年级上学期期末英语试卷.pdf VIP
- 硬膜下血肿的护理常规.pptx
- 2020年牛津译林版7A英语七年级上册Unit2-单元检测卷(含答案).docx VIP
- 机械精度设计与检测技术基础第2版杨沿平第八章键与花键连接1课件教学.ppt VIP
文档评论(0)