- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 27卷 第 6期 兰 州 交 通 大 学 学 报 V()L27No.6
2008年 12 』ourrlaloflmnzhou iaoDngUniversity I)ec.2008
文章编号 :1O01—4373(2008)06—0096—04
基于粗集和神经网络的用户访问模式挖掘
郑丽英 , 岳 岩 , 匡晓君
(兰州交通大学 Ct子与信息工程学院,甘m 兰州 730070)
摘 要:用户访 问模式发现是构建 自适应网站的关键技术.提 出了一种基于粗糙集和神经网络相结合的用户访 问
模式的发现方法,建立了用户访 问模式的一般模型.针对Web日志数据通常数据量大、冗余,以及 页面之间关系不
确定的特点,将粗糙集作为前端预处理器,简化信息处理空间,去掉冗余,采用神经网络聚类分类用户群,从而发现
用户访问页面的方式.最后,通过实验分析表明文中方法的有效性.
关键词:粗糙集;自组织神经网络;用户聚类;用户访 问模式
中图分类号:TP301.6 文献标识码:A
知识约简就是在保持知识库分类能力不变的前提
0 引言
下,删除其中不相关或不重要的知识.知识约简可以
随着 Internet的迅猛发展,信息容量呈爆炸性 减少后续挖掘算法在时间和空间上的压力.
增长趋势,尤其是Web的全球普及热,使Web上的 知识约简_3]在信息系统分析与数据挖掘等领域
信息量无 比丰富.Web挖掘作为数据挖掘的一个子 都具有重要的应用意义.知识之间的依赖性决定知
领域,其数据源的多样性和动态性等特点突破了传 识是否可以进行约简,根据依赖性所定义的知识的
统意义上的数据形式,并随着Web服务的发展受到 重要性往往是知识约简的重要启发式信息.
了越来越广泛的关注和应用.面 向新世纪发展需要 1)决策表的约简
的可持续发展的web站点必须为用户解决这些问 定义 12『] S一 (,K)为一知识表达系统,且
题.及时发现和预测不同用户在使用web站点时的 C,D R是两个属性子集,分别称为条件属性和决
问题,并相应调整Web站点的内容、结构和表现形 策属性,具有条件属性和决策属性的知识表达系统
式来解决相关问题,是 自适应站点研究的主要 目的. 可表达为决策表 了===(L,,R,C,D)或简称 CD决策
自适应站点能有效发现潜在用户和吸引原有用户, 表.关系 IND(C)和关系 IND(D)分别称为条件类
为网络服务的持续发展提供有力的保障,因此 自适 和决策类[4].
应站点的研究与实现,已经成为当前web数据挖掘 令 x是U中根据条件属性C可定义的类,y是
的研究热点口].而用户访问模式的发现是 自适应网 中根据决策属性D可定义的类,对于每个 , ∈
站的关键内容,本文给出了一种基于粗糙集和神经 U,定义一个函数为
网络的用户访问模式发现方法,可以对用户进行聚 d : c() SD(): n ≠0,
类并适时的向用户进行新页面的推荐. 对于 ∈X, ∈y.
函数d称为决策表 ,7、中的决策规则,是决策
1 粗糙集的属性约简
规则d 的标识,即决策表中集合U的元素不表示任
1982年波兰数学家 Z.Pawlak教授针对 G. 何实际的事物,只是决策规则的标识符.
Frege的
原创力文档


文档评论(0)