网站大量收购独家精品文档,联系QQ:2885784924

基于Web日志分析的校园网受众分析.pptVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于Web日志分析的校园网受众分析刘佐达清华大学网络中心目录背景介绍Web日志分析原理系统设计与实现实验结果及分析小结背景介绍数字化校园已经成为高等院校信息化建设的一个重要目标网络宣传阵地的竞争日趋激烈新的问题校园网宣传是否达到了预期的效果?用户在接收和使用校园网信息的时候具有什么样的特点?校园网信息的传播存在什么样的规律?Web日志分析原理Web日志记录了网站服务器接收、处理请求以及运行错误等各种原始信息Web服务模式主要有三个步骤服务请求,包含用户端的众多基本信息,如IP地址、浏览器类型、目标URL等。服务响应,Web服务器接收到请求后,按照用户要求运行相应的功能,并将信息返回给用户。如果出现错误,将返回错误代码。追加日志,服务器将对用户访问过程中的相关信息以追加的方式保存到日志文件中。Web日志分析原理(续)域(Field)描述(Description)日期(Date)请求页面的时间、日期和时区(Date,timeandtime-zoneofrequest)客户端IP(ClienIP)远程主机的IP或DNS入口(RemotehostIPorDNSentry)用户名(Username)远程登陆的用户名(Remoteloginnameoftheuser)字节(Byte)发送和接收的字节(Bytestransferred,sentorreceived)服务器信息(Server)包括服务器名称、IP和端口(Servername,IPaddressandport)请求(Request)URL查询(URLquery)状态(Status)返回HTTP状态标识(HTTPstatuscodereturnedtotheclient)服务名(Servicename)用户请求的服务名称(Requestedservicename)时间开销(Timecost)完成浏览所用的时间(Timetakenfortransactiontocomplete)协议及版本(Protocolandversion)传输用的协议及版本(Usedtransferprotocolanditsversion)用户代理(Useragent)服务提供者(Serviceprovider)Cookie标识号(CookieID)参考页(Reference)本页的上一页(Previouspage)Web日志分析原理(续)实验中采用的是NCSA公用格式,它是一种固定的ASCII格式,无法进行自定义。这种格式适用于网站,但不适用于FTP站点。NCSA日志实例:

“44-anonymous[25/Feb/2007:04:02:35+0800]GET/dzzsread.php?id=2331HTTP/1.120011493”远程主机名远程日志名称用户名日期时间和时差44-Anonymous25/Feb/200704:02:35+0800请求/版本服务状态码发送的字节数ET/dzzsread.php?id=233120011493输入与定制网络日志文件用户的特定需求01日志预处理去除无关信息02综合分析从特定信息数据库和IP数据库中抽取相关的数据,根据用户的定制进行综合分析,得到关于特定信息受众的IP分布数据03统计输出根据用户的需求绘制图表,并通过显示接口反馈给用户04系统设计与实现系统设计与实现(续)数据集清华新闻网(http://)是清华大学的重要信息发布中心清华大学计算中心提供清华新闻网的访问日志,作为实验数据,测试我们的系统分析功能用户地理位置分析访问特征分析实验用户地理位置分析将网络受众的地理位置分析分为校内、国内、国外三个类型用户地理位置分析

——校内受众分析案例一新闻《比尔·盖茨与清华学子精彩对话》发布后两个月内访问者在清华大学校内的分布用户地理位置分析

——国内受众分析案例二新闻《研招办进行2007年硕士研究生招生网上咨询活动》发布后三个月内的国内访问者分布案例三新闻《研招办进行2007年硕士研究生招生网上咨询活动》发布后三个月内的国外访问者分布用户地理位置分析

——国外受众分析时效型信息01.持久型信息01.间歇型信息01.通过分析访问量的历史曲线,可以对校园网信息做以下分类:访问特征分析访问特征分析(续)

——时效型信息新闻《第十六届清华校园十佳歌手产生》案例四特征发布后2~3天内访问量具有明显的峰起之

文档评论(0)

gongmengjiao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档