- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则的校园网web日志挖掘研究与实现-计算机应用技术专业论文
I
I
摘 要
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它涉及到人们 生活中的方方面面。人们不再对网站、网页这些名词感到陌生了,政府机关、高 校、公司都搭建了自己的网站,而且个人主页也相当流行。大家建设网站的目的 都是相同的,就是通过网络这个平台展示企业、公司形象,拓展大家相互间的沟 通和交流的渠道,是一个重要的交流窗口。同时人们也利用网络这个平台,实现 网上购物、网上缴费等功能,我们将它称之为电子商务。当大家在访问一个网站 时,当你点击网站上某个超文本链接时,网站的 web 服务器就会产生一条访问记 录,并存储在日志文件中。所以可以想象,每天一个网站会产生大量的访问记录。 Web 日志挖掘就是利用这些记录来分析访问者的爱好、访问习惯等。通过 web 日 志挖掘可以分析合理的布局网站结构、提高 web 的服务效率、及时的发现网络攻 击、发现电子商务的潜在客户等功能。
本文首先介绍了数据挖掘的理论知识,以及当前国内外的研究现状;然后介 绍了校园网的一些基本知识,指出了高校的校园网和其他商业网站之间的区别, 高校校园网主要是为教学、科研服务的;同时对 web 数据挖掘和 web 日志挖掘的 理论进行了研究,并详细的介绍了它们的主要研究方法和流程。Web 日志挖掘的 重点是数据的预处理技术和关联规则及基于关联规则的算法。
另外,还详细的介绍了关联规则及其经典算法 apriori 算法,并指出其不足 之处,提出了一些改进的策略。在具体实现的时候,提出了基于矩阵的挖掘算法 能更快的发现频繁项集。
最后,在对 web 日志挖掘理论和研究的基础上,设计实现了简单的 web 日志 挖掘系统。并利用挖掘系统对我校主页 web 服务器、招生就业服务器的日志和二 级单位的 web 服务器日志进行挖掘,并根据挖掘的结果对网站进行了改进。
关键词:数据挖掘 web 日志挖掘 关联规则 apriori 算法
II
II
Abstract
World Wide Web is a huge, widely distributed, global information service center, which involves every aspect of peoples lives. We are familiar with the Website and Web. The government agencies, universities, companies built their own websites, what’s more, home page is very popular. The purpose of all construction sites are the same, that is, the platform network display business, company image, and develop ours communication and exchange .It’s an important communication window. Same time, people also use the network platform to realize online shopping, online bill payment and other functions, we call it e-commerce. When you visit a website or click on a hypertext link to the website, the sites web server will generate an access record, and stored in the log file. So we can imagine that a site will have a large number of daily records. Web log mining is to use these records to analyze the visitors preferences, access habits etc. Through analysis of web log mining can analyze a reasonable layout of site structure, improve Web-services, discover network attacks in time and find potential customers e-commerce functions.
This paper introduces t
您可能关注的文档
- 基于公司治理下的国有企业财务监-会计学专业论文.docx
- 基于公司治理的上市公司内部审计研究-会计学专业论文.docx
- 基于公司治理的中小企业技术创新分析-企业管理专业论文.docx
- 基于公司治理下的财务信息与会计舞弊研究-会计学专业论文.docx
- 基于公司治理的上市公司内部审计模式研究-企业管理专业论文.docx
- 基于公司治理与并购绩效关系研究中国海外并购对策——惠普并购案的启示-工商管理专业论文.docx
- 基于公司治理下的内部审计机构设置与责任安排研究-会计学专业论文.docx
- 基于公司治理的企业社会责任实证分析-企业管理专业论文.docx
- 基于公司治理的会计信息传导机制研究-会计学专业论文.docx
- 基于公司治理的企业债券融资分析-西方经济学专业论文.docx
原创力文档


文档评论(0)