网站大量收购闲置独家精品文档,联系QQ:2885784924

高教社唐九阳大数据技术基础教学课件第11章 在线用户行为分析案例.pptx

高教社唐九阳大数据技术基础教学课件第11章 在线用户行为分析案例.pptx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十一章 在线用户行为分析案例;案例目标 案例准备 案例实战 ;目标:基于对用户过往行为的分析,主动为用户带来符合其关注需要或实际需求的内容。 效果: 可以确保用户能够快速发现与自身感兴趣的内容,节约用户时间成本,并切实提升用户体感度; 能够提升用户对电商网站的认可度,若推荐系统可以精准察觉用户关注点,并为用户带来合适资源,则用户会逐渐对该网站形成依赖感,这也有助于企业获得稳定的客户群体。 ;环境准备 数据预处理 构建全文索引 制作字典 分词算法 ;环境准备;数据准备;本文案例的具体目标是向用户提供合适推荐,即采取相关途径使得用户和网页之间形成联系,进而为用户节省信息搜索和获取时间,确保用户能够从海量数据中高效寻获所需内容,在现有较为单一的推荐系统中完成补充,可基于协同过滤算法完成推荐。具体思路如右图所示;用户在进入网站之后所浏览的内容较多,若对数据不作出分类研判,或将全部记录均作出推荐,则会造成下述问题:一是数据量过大;二是用户群体所关注的信息并不相同。 为规避以上问题,需对网站访问记录等作出分类,具体思路如右图所示;按照以上分析方法,根据本例中的原始数据信息和分析目标,能够得到完整的分析流程图;数据抽取 数据探索分析 数据预处理 模型构建;以用户访问时间为具体条件,选择三个月时间内用户访问网站的数据,具体时间为2020年2月至2020年4月,并将这些数据作为原始数据集。不同地区用户群体访问习惯、兴趣偏好并不相同,本案例以长沙市为对象,对当地用户访问数据作出分析,共获得857654条记录,具体内容覆盖用户账号、登陆时间、访问页面、来源网页、标签、关键词等。;网页类型分析 点击次数分析 网页排名;本次案例分析基于原始数据展开,整理与分析目标并无关联或模型使用需要处理的数据,具体预处理措施包括下述几项,即清洗、集成、变换,具体处理流程图见下图;理论上,有了特征之后,就可以比较各个章节的相似性了。然而问题是,现在有 50 个特征,也就是说现在的数据空间是 50 维的,这对于想象四维空间都难的人类来说是很难可视化的。对于高维数据的可视化问题来说,PCA 是一个很好用的数学工具。;在构建推荐模型时,可选择多种推荐方法。为提高推荐精准度,大多数情况下均需综合使用多种推荐方法得出推荐结果,一般在对推荐结果作出组合时,可运用串行法或并行法。本案例选用并行法;首先需关注如何应对冷启动问题,在出现新用户后,考虑如何更好完成推荐?;本章主要介绍了协同过滤算法在电子商务领域中的应用,实现了对用户的个性化推荐。通过对用户访问日志的数据进行分析与处理,采用基于物品的协同过滤算法对处理好的数据进行建模分析,最后通过模型评价与结果分析,发现基于物品的协同过滤算法的优缺点,同时对其缺点提出改进的方法。结合上机实验,有助于更好地理解协同过滤推荐算法的原理以及处理过程。;参考文献

您可能关注的文档

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

副教授持证人

知识共享

领域认证该用户于2024年11月14日上传了副教授

1亿VIP精品文档

相关文档