基于马尔可夫链的点击流技术在校园网评估分析中应用.pdfVIP

基于马尔可夫链的点击流技术在校园网评估分析中应用.pdf

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!

计算机科学2008V01.35№.4B 基于马尔可夫链的点击流技术在校园网评估分析中的应用 王萍萍戴上平郑世珏单亚静 (华中师范大学计算机科学系 武汉430079) 摘要本文提出了一种通过对点击流分析用户对校园网站最可能的浏览路径的模型,目的是能够更好地评估校园 网的建设情况,并将数据挖掘技术应用于点击流分析,采用马尔可夫链模型,然后通过对点击流串化处理计算点击流 的状态转移矩阵,以期从大量点击流中发现网页的浏览规律,从而为校园网的建设提供技术支持。最后本文还对校园 网的数据进行了试验和分析,仿真结果显示了所建模型的合理性和有效性。 关键词校园网,数据挖掘,点击流,马尔可夫链 1校园网的日志文件中记录了对该网站很长一段时间的访 1 引言 问数据,处理后得到一个称为序列的数据集合。这个数据集 随着数字化校园的迅速发展,校园网内存储了海量的网 合包括用户标识(U_No),一个用户连接特定网页的日期时间 络信息。为了给访问者提供最大的便利以及有效的管理校园 变量(U_time)和浏览的网页(U』age)。 网的传播及监控问题,我们需了解校园网的宣传是否达到了 表1数据集 预期的效果,用户在接收和使用校园网的时候具有什么样的 U—No U—Time U 特点,而校园网信息存在什么样的规律等,从而优化校园网站 65ee683a6df… 2Nov2007:14:12:03图书馆 的建设。 65ee683a6df-“ 2Nov2007:14:13:25教务处 65ee683a6df” 对于一个网站而言,网站浏览量、点击数、独立IP访问数 2Nov2007:16:07:44首页 65ee683a6df… 等参数是反映这个网站用户访问情况的重要指标。通过分析 2Nov2007:17:11:18计算机科学系 那些访问过的网页的有序数据可以预测访问者对www站 点的访问行为。由于任何时候当一个用户连接到一个站点 3基于马尔可夫链的点击流分析 时,服务器就会在日志文件中记录它的所有操作,这样可以获 马尔可夫过程是一个典型的随机过程。时间离散、状态 得用户使用键盘或鼠标浏览站点时的点击流。因此本文采用 离散的马尔可夫过程称为马尔可夫链。马尔可夫链中,各个 马尔可夫链模型,通过对大量点击流的分析发现网页的浏览 时刻状态的转变由一个转移的概率矩阵控制。 规律和通过较少的计算量发现请求网页的相关性,从而可优 3.1马尔可夫链模型 化Web站点超链接结构。 马尔柯夫链是随机过程中应用最广泛的数学模型之一。 2点击流分析 随机过程是描述随机变化系统的数学模型,最初由俄国著名 数学家A八马尔柯夫提出,后经w.费勒和P-莱维广泛深 所谓点击流是指用户在

您可能关注的文档

文档评论(0)

sjatkmvor + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档