论网站点击次数的正态分析方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论网站点击次数的正态分析方法 奚回 (单位略 陕西 西安 710068) 李兴波 (保定金融高等专科学校 河北 保定 071000) (特别说明:本文是作者为了学习实证分析方法而刻意研究的一个问题,实用意义可能不大,练笔而已,敬请各位专家批评指正。) 摘要:现行的网站点击次数分析方法有明显的缺陷,其根源在于没有对点击次数作随机变量考察。本文作了这种考察,并验证了它服从正态分布。正态分布的参数可以帮助网站分析其发展状况、与同业比较、制定科学的管理目标、考核员工等多种分析目的。这种以正态分布为基础的分析方法,本文暂称为网站点击次数的正态分析方法。 关键词:点击次数;分析方法;正态分布;参数 一、网站点击次数现行分析指标的缺陷和本文问题的提出 随着我国经济社会的发展,计算机网络的应用已越来越普及,并发挥着越来越重要的媒介作用,因此,如何管理网络也变得越来越重要。 对一个网站来讲,点击次数(本文的分析方法,也适用于其他类似于点击次数的现象,如“某论坛某天发表的文章数”)的高低直接影响着其经营目标的实现程度,所以各网站总是极尽所能地提高其点击次数,并引入了一些与点击次数有关的分析指标,如最高点击次数、点击次数的不同期比较、点击次数的时间序列变化、一定期间点击次数的平均值等[1]。同时,对于点击次数及其他网络流量信息重要性的关注也催生了商业性分析软件的应用,如ITSUN网站流量 2、最高点击次数是极端值,价值有限。 3、各网站客观上需要能够在同业间相互比较的标准指标。 4、考察点击次数出现在某个区间的概率(或频率)有助于网站制定科学的管理目标和考核标准。但现行的分析方法没有涉及此分析角度。 5、点击次数存在“周周期性”,即点击次数以一周为一个周期上下波动。 图2是晋城在线两周的点击次数时间序列图,它直观地说明了其点击次数存在周周期性: 点击次数存在周周期性的原因,可能是因为大部分用户访问网站的时间受其工作时间的周周期性的影响。这种周周期性会影响现行考核分析指标结果的正确性或正确程度。下面以晋城在线2005年11月和10月的点击次数对比分析为例,来说明这种影响的显著及剔除这种影响的方法: 该网站11、10月的点击次数分别98024557次,则: 1、不考虑周周期性的影响。则11月的日均点击次数为3186050次,10月为3162082次。比较可知,11月的业绩高于10月,因为11月的日均点击次数上升了23968次。但这只是假象。 2、考虑周周期性的影响。注意到,除4个整周外,10月余周一、六、日3天,11月余周二、三2天。我们已知晋城在线的点击次数明显地存在周周期性,周六、日在低点,周二、三在高点,所以10月的点击次数合计明显受低点影响,而11月则受高点影响。要剔除这种影响,方法是:忽略非整周数据中的周周期性数据,而保留其中的非周周期性数据(避免将非整周数据中的非周周期性数据也一同忽略掉了),然后将保留的数据并入4周数据中按4周计算日均点击次数。其中,某天(例如周六)的点击次数周周期性数据,就是各周该天点击次数的期望值(平均值)。这时,11月的日均点击次数为3168104次,10月为3162529次。比较可知,11月的业绩比10月仅微弱上升,因为11月的日均点击次数比10月仅上升了5575次。 比较而言,本文认为第二种方法是科学的方法。 上述方法的对比,说明了点击次数周周期性对于分析结果正确性或正确程度影响的显著,而要理解并剔除这种影响,则需要对点击次数作随机变量考察。 鉴于以上对网站点击次数现行分析指标缺陷的分析,注意到:网站“某一天的点击次数”是随机变量,它服从正态分布(后有实证检验),这使得利用正态分布的参数(μ,σ2)对它进行科学考察成为可能。所以,本文就拟从正态分布的角度,对网站点击次数分析方法进行研究,以期能改善现行指标的分析效果,或提出更有效的指标。 本文研究所用网站点击次数数据是“晋城在线”网站提供的公开的“晋城在线网站全频道点击次数月报表”(2005.7-12)[3]。在此,对该网站支持科学研究的实际行动表示感谢。 另外,在本文写作过程中,笔者曾查阅了相当数量的文献资料,但未发现一个与本文研究思路和内容类似或有关的文章,这使笔者的参考与借鉴无从进行,所以文内的不足可能在所难免,谨期能抛砖引玉。 二、对“晋城在线”点击次数服从正态分布的实证检验 表面上看,点击次数是离散型数据,但因为它取值范围广泛(0至几百万),所以应该把它看作连续型变量进行考察。经笔者检验分析,证明晋城在线的点击次数服从正态分布。表一是根据晋城在线2005年7-12月每天的点击次数样本数据计算的正态分布的分布函数(注意不是密度函数)频率概率对比表(其中ξ为实际点击次数除以10万后的四舍五入):

文档评论(0)

lyxbb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档