对中国曾有过静态网页数的一种估计.pdfVIP

对中国曾有过静态网页数的一种估计.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对中国曾有过静态网页数的一种估计.pdf

北京大学学报(自然科学版),第 卷,第 期, 年 月 ! ! #$$! % ’() *’+,-(+)./0 1)(/.)2+/0 , , ( , ) 3-+4,.5+()(+5 6,7+-,-5+5 892 : ! 19 : ! ;) #$$! 对中国曾有过静态网页数的一种估计!) 李 晓 明 (北京大学计算机科学技术系,北京, ) =$$?= 摘 要 根据北大天网系统在#$$# 年初的一次网页搜集结果,特别是当前仍然存在网上但“最后 修改时间”不是#$$# 年网页的数量,本文提出了一种估计过去网页数量的模型,并据此对中国自从 =% 年以来的静态网页数以年为时间单位进行了估计,从而得到了一个增长曲线,在一定的理论 意义上验证了人们常说的“网上信息爆炸性增长”的特性。 关键词 互联网;因特网;网页;网络动力学 中图分类号 @6 !! 引 言 尽管 等新技术在发展并有一致看好的前景, 网页依然是人们制造和消费网上 D;E F@;E 信息的主要形式。因此,网页的数量是网上信息建设规模的一个基本指标。中国互联网络信 息中心( )从 年开始,每半年发布一次有关全国网站数量,网民数量等统计信息,但 G11HG =? 关于网页的数量只是在 年 月的“中国互联网络信息资源数量调查报告”中才开始有所 #$$= I [] = 反映 。这意味着 ()网页数量已经成为 关心的一个指标; = G11HG ()这个数量在 年以前的情况已经不可能统计得到了。 # #$$= 本文旨在对它们做一个估计,从而得到过去? 年来中国网上信息规模成长的一个概貌。 实际上,抛开网页所含的内容不谈,仅仅网页和网站的数量以及由JK,.2+-7 在它们之间建 立的关系,已经是很有意义的研究对象了。文献[]研究了网页之间的链接距离,文献[]研究 # ! 了以网页数衡量的网站规模的概率分布,文献[]所讨论的是由于网页之间自发发生的链接关 I 系所形成的所谓“网上社区”( )。从这些工作可以看到关于网络信息世界的研究 L,M ’900/-+( 上正在从 个不同的层次展开,即 )信息资源量及其分布;)海量信息之间的关联结构; ) ! = # ! 信息内容。本文属于第一层次的一个结果。 下面第 节给出一些相关的技术准备,说明本文所作的估计不是纯粹的数学结果,而是基 = 于北大“天网”系统的一次收集的统计;第# 节建立一个针对这些统计数据的模型,然后根据这 个模型得到估计结果;最后在第 节对这个结果进行分析,并对它可能对其他人们关心的指标 ! (例如网页的“半衰期”)产生的影响进行讨论。 ) 和 ( )资助项目 = % ?! A=$!#?$B 收稿日期: ;修回日期: #$$#C$%C$? #$$#C$?C$ 万方数据 第 期 李晓明:对中国曾有过静态网页数的一种估计 I

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档