- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于点击技术的用户兴趣数据挖掘研究
摘要:深入研究了基于点击技术的方案的服务流程和体系结构,根据方案的特点和实施要点总结出实现点击流信息服务方案的实施流程。对点击流数据的主要来源Web日志文件结构和内容进行深入的分析,总结出点击流数据的预处理内容和方法,使之变成能够进行数据挖掘和数据分析的数据仓库表文件。
关键词:用户点击;数据挖掘;Web日志
中图分类号:TP274文献标识码:A文章编号:1009-3044(2009)33-9412-03
Click on the User Interest in Data Mining Technology Research
YAN Bing-kuan
(Xinxing Pipes Group Technology Center,Handan 056017,China)
Abstract: The in-depth study of the program click technology-based service processes and architecture, based on program characteristics and implementation of the key points summarize information services to enable click-stream implementation of the program flow. Right click-stream data, the main source of Web log file structure and content of in-depth analysis, summarized clickstream data pre-processing the content and methods to be turned into to carry out data mining and data analysis of the data warehouse table file.
Key words: user hits; data mining; web log
在电子商务网站环境中,点击流的分析越来越有价值,已经远远超出点击流的范围,对这些数据深层次分析已经成为电子商务网站了解经营状况、了解用户行为的有效工具。点击流分析以WEB上的点击流数据为基础,利用OLAP、数据挖掘等技术满足电子商务企业的所有人员的需求。不同的部门有不同的需求,通过对点击流数据不同角度的分析来达到不同的目的。
1 基于点击流技术的服务方案
基于点击流的个性化信息服务方案主要是对电子商务网站信息用户浏览信息的行为采用点击流技术进行记录、采用数据挖掘的方法,分析得出用户在不同时期内的准确而全面的信息兴趣。同时为了弥补方案初期用户浏览信息记录数据的不足,分析不准确的缺点,在用户成为网站用户的初期采用用户定制信息的方式。具体实现机制是:
1)在用户最初注册时根据用户填写的基本信息,为用户提供个性化信息推荐服务;
2)利用点击流技术对用户对信息行为记录跟踪,通过建立点击流数据仓库、点击流数据集市抽取用户信息行为的相关数据,再利用商务智能工具进行用户当前信息需求偏好的分析,对用户需求信息的类型加以修正、补充;
3)再通过点击流技术对用户推荐的信息行为跟踪,对分析模型进行评测、改造,直至提出一个完善的用户信息行为分析模型。
这个个性化信息服务的流程如图1所示。
2 基于点击流技术的服务结构
本文所描述的用户信息兴趣分析主要使用Web内容挖掘和Web使用记录挖掘对Web日志文件和网站信息页内容进行挖掘,得出加权的用户曾访问过信息类和信息关键字,然后通过聚类的方法得出用户的信息兴趣集合,来判定用户感兴趣的信息。然后通过信息推荐平台把网站的信息页和分析得出的信息兴趣集合进行比对,符合一定条件的信息将由系统自动推荐给用户。用户信息兴趣分析阶段主要是离线完成,信息发布阶段主要是在线进行,以满足用户的信息需求。
系统的体系结构见图2,图中分为两个部分,用户信息访问兴趣分析部分和信息发布部分。由于每个用户都有不同的登录时间和兴趣类型,信息发布是根据用户访问行为的不同实时地进行信息发布的,因此信息发布部分为在线处理部分。而用户访问信息兴趣分析部分则为离线处理部分。
3 基于点击流技术的用户兴趣服务设计
基于点击流技术的用户兴趣服务方案的实现分为用户访问信息兴趣分析和在线发布信息两个部分,在离线部分中要对点击流数据进行收集,预处理和建立点击流数据仓库才能建立起对用户访问兴趣分析的数据基础,用户的信息兴趣描
文档评论(0)