2014年演示毕业论文答辩.pptVIP

下载本文档

0
0
约1.94千字
约 21页
2017-09-03 发布于江苏
举报
版权申诉

2014年演示毕业论文答辩.ppt

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Web数据挖掘在个性化自适应网站中的应用研究信息工程学院计算机科学与技术1班郝雅林 ★论文结构引言数据挖掘以及Web数据挖掘 Web日志挖掘聚类算法基于Web日志挖掘的个性化自适应网站 Web日志挖掘在个性化自适应网站中的应用实现背景、意义、研究现状定义、分类、步骤定义、模型、数据类型、预处理、模式分析、模式发现定义、算法工作流程、设计原则、系统架构、主要模块实现环境、过程、动态链接的自动生成、推荐页面 ★研究背景 Web页面复杂，无结构、并且是动态的，导致人们难以迅速地在Web上找出所需要的数据和信息。Web 数据挖掘以及在此基础上建立的自适应网站对满足用户的个性化要求有很好的应用效果。在网站的设计实现过程中，能够根据用户的访问兴趣来进行个性化推荐，提高用户对网站的浏览效率，更加有针对性的满足用户的需求。基于Web数据挖掘和自适应网站的优点，在电子商务日臻成熟和以人为本的今天，它有着广泛的应用前景。 ★研究目的论文主要研究目的是Web日志挖掘在自适应网站中实现动态链接。研究利用 Web 使用挖掘分析日志以获得信息，并且达到网站的智能，使其自适应的提供个性化推荐服务。 ★研究方法通过查阅图书馆的相关资料以及利用因特网查找相关领域的最新理论、收集资料以及在指导老师的指导和同学之间的交流和沟通下，完成此论文。论文中采用Web页面聚类挖掘方法实现对日志的分析，并采用在网页中插入ASP代码的方式实现个性化页面的推荐。 ★论文主要内容本文主要研究内容如下：基于数据挖掘研究，设计一个包括数据净化、用户识别和会话识别等过程的数据预处理过程，构建Web日志挖掘过程模型；定义自适应网站，根据系统实现的目标以及设计所遵循的原则，研究设计系统工作流程、系统框架以及系统主要模块；提出自适应网站进行自动页面调整的方法。 ★论文创新之处本论文侧重于Web日志挖掘理论框架的研究，在论文中，本人通过对现有的基础理论和方法的学习和研究，特别对数据挖掘中聚类算法的应用进行了较深入研究，并使用ASP代码实现了个性化页面的推荐。 Web日志挖掘分类 Web挖掘 Web内容挖掘 Web结构挖掘 Web日志挖掘信息检索领域数据库领域数据 -文本文档 -超文本文档 -超文本文档 -链接结构 -Web服务器日志 -代理日志、缓冲日志数据特征 -非结构化 -半结构化 -半结构化 -结构化 -链接结构 -用户的访问数据数据表示形式 -有序/无序的单词集合 -术语和短语 -关系曲线 -对象交换模型 -关系曲线 -网站拓扑结构图 -关系表 -图方法 -统计 -机器学习 -关联规则及变形 -专利算法 -关联规则及变形 -专利算法 -统计 -关联规则 -聚类应用领域 -分类 -寻找抽取规则 -寻找文本模式 -发现频繁子结构 -提取Web 网站大纲 -分类 -聚类 -站点结构管理 -个性化站点 ★三种Web挖掘比较 Web日志挖掘过程模型自适应网站的工作流程自适应网站设计架构自适应网站的系统结构图用户注册前的页面新用户浏览网站时的界面老用户浏览网站时的页面 ★总结在课题研究中，对基于Web 数据挖掘的个性化自适应网站研究完成了以下工作，并取得了一些研究成果：在对Web 数据挖掘和基于数据库的数据挖掘对比研究基础上，研究了包含数据净化、用户识别和会话识别等过程的数据预处理模型，并分析了Web 日志挖掘的过程。基于对用户感兴趣页面的预测，动态地构建网站结构，自动实现动态链接。采用聚类算法对用户访问模式进行挖掘，并通过在网页中嵌入Asp 代码的方式，用程序实现了自动在页面中增加动态链接。 ★论文需要改进的地方提高用户识别的精度。加强对聚类算法时间复杂度和空间复杂度的优化，缩短大规模日志数据挖掘时间。加强对挖掘结果的分析、比较和评价。总之，尽管上述的研究成果是初步的，限于实际条件有的还没有完全实现，但以后还要继续向这个方向进行开展研究工作。在基于Web日志的用户聚类在个性化服务中的研究具有较强实际应用价值，还要需要进一步深入研究。 ★致谢本文是在崔虹燕老师的悉心指导下完成的，从选题到成文，崔老师都提出了许多建设性的意见，并在繁忙的工作中抽出时间仔细审阅了全文。她严谨的治学态度、诲人不倦的精神品质令我难以忘怀。最后，要感谢所有给予我无私关怀与支持的所有老师和同学们，四年来一如既往地支持我的学业，对他们的感激之情是无法用语言来表达的。