- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
· 计算技术与自动化 ·
模糊集在 web用户聚类中的应用
王 华 ,王治和,杨天霞,王凌云
(西北师范大学数学与信息科学学院,甘肃 兰州 730070)
摘 要:本文提 出了一种考虑网页分类的用户聚类方法,从而降低了用户一页面访问矩阵的维数。
关键词 :模糊聚类;模糊矩阵
中图分类号:TP311.13 文献标识码 :A
Fuzzy SetApplication in W eb UserCluster
WANG Hua,WANG Zhi—he,YANG Tian-xia,WANG Ling-yun
(CollageofMathematicsInformationSciences,NormalUniversity,GansuLanzhou730070)
Key words:fuzzy clustering;fuzzymatrix
Web信息是海量的,但知识是贫乏的。Web挖掘是从半 和,称为此页面的访 问频度l31
结构或无结构的Web页面中,以及使用者的活动中,抽取感兴 定义2.用户兴趣度是该用户对某个页面的访问次数研有用
趣的、潜在的模式,分析、研究 ,并加 以利用 。Web挖掘包括 内 户对该页面访问次数的比值[4】
容挖掘 ,使用挖掘 ,结构挖掘 。其 中Web日志挖掘技术可 以 定义3.用户一页面访问矩阵
从服务器的 日志文件 中获取用户的访 问模式,并根据这种模
式对用户或页面进行聚类,挖掘出具有相似访问兴趣的用户。以
便更好地为用户推荐可能感兴趣 的新页面,动态地提供个
性化的服务。
文献-[】是基于用户访问时间构造模糊矩阵对用户进行聚类,
文献 基于用户访问次数构造模糊矩阵对用户进行聚类。但是
这些聚类并没有考虑到网页与用户之间的联系。只是单纯的考
虑了用户的访问次数和浏览时间。为此,本文提出了一种考虑网
T(Y.,X)
页分类的用户聚类方法,从而降低了用户一页面访问矩阵的维
数。实验证明这种方法能得到满意的用户聚类。 ∑TY(.,X)
k= l
1 模糊集 计算出每一页面在单位时间内被各个用户访问的次数,及
模糊理论是 L A..Zadech于 1965年提出的,对于论域 u, 每一页面在单位时间内被所有用户访问的总次数。5[1
任一元素x,有A(x)∈[0,1],称A为u上的模糊集。表示x隶属 定义5.相关的网页可能被具有相似兴趣度的用户浏览 。
于A的程度。 越接近于 1,表示 x属于A的程度越高,越接近 2.3算法具体流程
于0表示x属于A的程度越低。用取值于区间0【,1】的隶属函数 算法的具体流程如下。
表征x属于A的程度高低。一个数据集的隶属度的总和等于 1。 Step1.以用户对页面的浏览次数来构造用户一网页访问矩阵u。
Step2.利用定义4来构造模糊矩阵U。
∑uii=lYj=l…2--n
Step3.利用最大一最小法 [7】对模糊矩阵U相似化
在Web日志挖掘的过程中,由于对用户 、Web页面等Web Step4.利用编网法对网页进行聚类。
对象进行聚类时具有明显的模糊性,因此这里将模糊数学中的模 Step5.通过上一步得到的结果 ,将相似的网页聚合在一起 ,
糊聚类与Web数据挖掘相结合,提出了对Web日志进行模糊聚
您可能关注的文档
最近下载
- 教你如何破解软件OD破解软件OD使用教程.doc VIP
- 施工重大危险源辨识与防控措施月报表.pdf VIP
- 人教版(部编版)小学语文五年级上册 圆明园的毁灭第二课时 名师教学PPT课件.pptx VIP
- 一体机-柯尼卡美能达-bizhubC220说明书.pdf VIP
- BS EN 60079-32-2-2015 国外国际规范.pdf VIP
- 急诊科患者转运途中突然病情变化应急预案.pptx VIP
- G30连云港至霍尔果斯高速景家口至清水驿段扩容改造报告书.pdf VIP
- 股骨粗隆间骨折护理查房——护理问题及措施与健康指导.ppt VIP
- 零星工程 投标方案(技术方案).docx
- 一种比色法检测金黄色葡萄球菌活菌的Cu-MOF材料及其制备方法和应用.pdf VIP
文档评论(0)