基于SOM神经网络和模糊聚类的Web日志增量挖掘研究-计算机应用技术专业论文.docxVIP

基于SOM神经网络和模糊聚类的Web日志增量挖掘研究-计算机应用技术专业论文.docx

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SOM神经网络和模糊聚类的Web日志增量挖掘研究-计算机应用技术专业论文

摘 要 随着信息爆炸时代的来临,数据动态更新的速度加快,网民面对海量的数 据信息往往显得无从下手,出现了所谓的“信息过载”现象。为了在大量的数 据中提取出人们感兴趣的知识,一种根据用户浏览 Web 站点时留下的一系列点 击动作的记录,推测用户的需求和偏好,为用户提供个性化推荐技术的研究就 逐渐成为当前一个重要的课题。 首先,本文综合考虑了经典的 SOM 神经网络和模糊聚类算法的特点,提出 了一种基于 SOM 神经网络和模糊聚类的挖掘算法。通过预设一个较大的输出神 经元个数,利用 SOM 神经网络对数据集进行粗聚类,得到粗聚类中心集。接着 将粗聚类中心集作为模糊聚类算法的输入参数,对原始数据集进行细聚类,并 输出聚类中心集。最后通过类合并算法判断聚类是否需要合并,并输出最后的 聚类集合。由于改进的算法采用了 SOM 粗聚类输出的聚类中心作为模糊聚类算 法的初始聚类中心,解决了模糊聚类算法的多个随机初始聚类中心可能出现在 同一个聚类中,导致最终聚类效果不理想的问题。算法中采用了类合并算法, 使得模糊聚类算法并不需要人为指定聚类的个数,降低了模糊聚类算法对初始 聚类中心的个数过于依赖的问题,并能够发现不同形状的簇。 其次,本文在基于 SOM 神经网络和模糊聚类的挖掘算法基础上设计了一种 Web 日志增量挖掘算法。该算法对噪音不敏感,充分利用了上次的挖掘结果, 能够快速地进行增量更新,适用于对数据更新频繁的数据库进行增量挖掘。特 别是对 Web 日志这类数据量相对比较大,更新频繁的动态数据库,该算法有比 较明显的优势。 最后,本文设计并实现了 Web 日志增量挖掘模型,通过对预处理过的 Web 日志数据进行了多次实验分析,对本文提出的算法的性能进行了评估。实验结 果表明本文提出的算法相对于传统的聚类算法具有更好的稳定性和适应性,能 够处理动态数据库增量更新问题。 关键词:Web 挖掘;SOM 神经网络;模糊聚类;增量挖掘 I ABSTRACT With the coming of the era of information explosion, dynamical data updated much faster. Internet users always dont know how to do when they face vast amounts of data. The phenomenon of so-called information overload appears. In order to extract the knowledge people interested from large amount of data, a technology to provide users with personalized recommendations which can infer peoples request and preferences based on a series of clicks records what users leave when they browse websites gradually become an important issue. Firstly, the characteristics of the classic SOM neural network and fuzzy clustering algorithm were considered in this paper, and a mining algorithm based on SOM neural network and fuzzy clustering algorithm is proposed. By setting a big number as the number of output neurons, we can get the rough clustering center sets by using SOM neural network. Then set the rough clustering centers as the input parameters of the fuzzy clustering algorithm and we can get the clustering centers by using fuzzy cluster method. Finally the class merging algorithm determines whether a cluster need to be merged, and output the final clustering set

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档