互联网Web数据挖掘模型设计与技术实现.pdfVIP

互联网Web数据挖掘模型设计与技术实现.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
IⅢ rh 论文选登 互联网Web数据挖掘 模型设计与技术实现 张韬 胡曼 国家广播 电影 电视总局规划院 随着Internet~D行业电子化的趋势越来越明显。如何更加深入地了解客户需求 信息和行为特征,更好地利用互联网的海量信息辅以决策管理,是当前信息 研究的主要内容之一 数据挖掘作为数据库、数据仓库的重要应用技术之一 ,能够为正确的商业决 策提供强有力的支持和可靠的保证 。但是传统的数据挖掘方法大部分只能对 同质 的同构的数据进行分析 ,这埘于互联 网上 的大量的异构的文本信息、日 志信息、超链接等不太适用 。因此 ,在传统的数据挖掘的基础上产生了一个 新的技术——Web数据挖掘 68 【 卫 星 与 网 络 I 1Web蠡据挖■ 1.1=量舞挖■的定义 web数据挖掘 (WebDataMinlng),是从数据挖棚发 艘过来的涉及Web技术 、数据挖捌 、计算机技术l、信息科学 等 多个领域的一项技术 Web挖掘灶指从大煅Web文梢的 合c中发现隐龠的模式P.AI粜将c精作输入.将l秆作输m. 那么Web挖掘的过程就是从输入到精m的一个映射 :C一+I 1.2Webt据控■的分赛 w b敬槲有3种类型:H1’M1标记的Web文档数据、Web 文档 内连接的结构数据m用户访问数据。按 照对应的数据类 . Web挖掘 以分为:{娄 :Web内容挖蜘 、we鸭 构挖掘和 Web使JH挖掘 . 2基 2 1j 为数据挖掘准备好合适的数据 ; 基于Internet的Web挖掘主要包括Web内眷挖掘和Web (2)用户频繁访问路径推荐 :系统提供墒问模 式挖掘 使用挖掘。通过Web内弈挖掘.可以进行 网络海 熊信息的网 引孽,得出用r1棚繁访 问路径,井 以页而链接形式曼现给用 上采集 ;通过Web使用挖掘,可以帮助企业理解客户行为. 户 .也就是说系统可以 动 |只别记忆每个用户频繁访问的页 从而政进站点结构.调照销售镀蹄.提供个性化的服务。 而 .枉这个凡1户 】次谢问时将这个页而的链接显示在主页 Web使用挖掘是指对用户访问Web时在服务器上留下 的 上,用户通过链接可以直接链接到该页而 ,省去了用户点击 I方问记录进行挖掘的方法 Web使用挖ilil的研究对象是来 自 多个页简找到自己感 趣内容的麻烦; 用户与Web相互联系产生的数据。它包括Web]~务器访问 日 3【)基于用户聚类的挖掘 :除了向用户推荐它的额繁访 志 、代理服务器日志 、浏览器日志、用户情息 注册数据 、 问路径的链接 ,本模型还引入 了撼于用户聚娄的挖掘,即向 用户会话或事务数据等用户与Web两者之 间联系产生的其它 用j推荐他所属用户聚娄组其他成员访问的信息 由于该用 数据 。Web使用挖掘是从这些数据中抽取 “感兴趣”的模式 户和本组其他用户的请 问行为是相似的.所以其他用户 问 的过程 w曲使用挖掘的过程 过的信息浚用户也很可能熬兴趣 ; 分为数搦采 、数据l罔处理 (4)实时推荐功能:阻别当前在线用J.从模式库中提 模式发现和模式分析4个阶段 取用户的访问模式。形成推荐信息集合.推荐培用户.以实 2.2攮噩总体设计 现个性化的服 务。 22.1基体囊式鼍甘 223.体蕞蕾冉t计 基于wPb挖掘柏特 点 , 按照分屡的思想将上述功能内顶向下分为3个模块 本文摊 ¨1这样一种服务模式 : (】)

文档评论(0)

jsntrgzxy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档