基于关联规则的校园网web日志挖掘研究与实现-计算机应用技术专业论文.docxVIP

下载本文档

4
0
约4.92万字
约 62页
2019-02-26 发布于上海
举报
版权申诉

基于关联规则的校园网web日志挖掘研究与实现-计算机应用技术专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于关联规则的校园网web日志挖掘研究与实现-计算机应用技术专业论文

I I 摘要万维网是一个巨大的、分布广泛的、全球性的信息服务中心，它涉及到人们生活中的方方面面。人们不再对网站、网页这些名词感到陌生了，政府机关、高校、公司都搭建了自己的网站，而且个人主页也相当流行。大家建设网站的目的都是相同的，就是通过网络这个平台展示企业、公司形象，拓展大家相互间的沟通和交流的渠道，是一个重要的交流窗口。同时人们也利用网络这个平台，实现网上购物、网上缴费等功能，我们将它称之为电子商务。当大家在访问一个网站时，当你点击网站上某个超文本链接时，网站的 web 服务器就会产生一条访问记录，并存储在日志文件中。所以可以想象，每天一个网站会产生大量的访问记录。 Web 日志挖掘就是利用这些记录来分析访问者的爱好、访问习惯等。通过 web 日志挖掘可以分析合理的布局网站结构、提高 web 的服务效率、及时的发现网络攻击、发现电子商务的潜在客户等功能。本文首先介绍了数据挖掘的理论知识，以及当前国内外的研究现状；然后介绍了校园网的一些基本知识，指出了高校的校园网和其他商业网站之间的区别，高校校园网主要是为教学、科研服务的；同时对 web 数据挖掘和 web 日志挖掘的理论进行了研究，并详细的介绍了它们的主要研究方法和流程。Web 日志挖掘的重点是数据的预处理技术和关联规则及基于关联规则的算法。另外，还详细的介绍了关联规则及其经典算法 apriori 算法，并指出其不足之处，提出了一些改进的策略。在具体实现的时候，提出了基于矩阵的挖掘算法能更快的发现频繁项集。最后，在对 web 日志挖掘理论和研究的基础上，设计实现了简单的 web 日志挖掘系统。并利用挖掘系统对我校主页 web 服务器、招生就业服务器的日志和二级单位的 web 服务器日志进行挖掘，并根据挖掘的结果对网站进行了改进。关键词：数据挖掘 web 日志挖掘关联规则 apriori 算法 II II Abstract World Wide Web is a huge, widely distributed, global information service center, which involves every aspect of peoples lives. We are familiar with the Website and Web. The government agencies, universities, companies built their own websites, what’s more, home page is very popular. The purpose of all construction sites are the same, that is, the platform network display business, company image, and develop ours communication and exchange .It’s an important communication window. Same time, people also use the network platform to realize online shopping, online bill payment and other functions, we call it e-commerce. When you visit a website or click on a hypertext link to the website, the sites web server will generate an access record, and stored in the log file. So we can imagine that a site will have a large number of daily records. Web log mining is to use these records to analyze the visitors preferences, access habits etc. Through analysis of web log mining can analyze a reasonable layout of site structure, improve Web-services, discover network attacks in time and find potential customers e-commerce functions. This paper introduces t