基于关联的聚类分析在个,陡化.PDFVIP

下载本文档

1
0
约1.22万字
约 4页
2019-01-14 发布于天津
举报

基于关联的聚类分析在个,陡化.PDF

基于关联的聚类分析在个,陡化

2 情报杂志 Vo1．28 N()．3 第 8 期 2009年 3月 JOURNALOFINTEILIGENCE Mar． 2009 基于关联的聚类分析在个，陡化服务中的应用 * ApplicationinPersonalizedServiceBasedonClusterAnalysisofAssociation 陈雪刚，2 李肯立2 (1．湘南学院数学系郴州 423000；2．湖南大学计算机与通讯学院长沙 410073) 摘要运用关联规则，确定用户频繁访问模式，使用页面相似聚类分析对用户频繁访问集分类，挖掘具有相似访问兴趣的网络用户的浏览模式，并对相关算法作了改进。从满足用户个性化信息服务出发，给出一种基于关联的用户访问模式聚类方法。实践证明，将基于关联的聚类分析方法应用到个性信息服务中是有效的。关键词关联规则数据挖掘聚类个性信息服务 Web日志中图分类号 TP391 目前大部分数字图书馆都提供了丰富的结构化数供能够用于决策支持、智能查询、科学研究等知识服务字信息资源包括电子图书、期刊、学位论文、报纸、政府方面的规则和模式。公报等，另外，随着 Intemet／Intranet的不断发展，基于收集web服务器上的13志文件，这里所讨论的数 web形式的非结构化或半结构化信息总量和信息交互据集类型都是web服务器上的日志，其日志文件一般量已经变得非常巨大，为了查询信息，一般为用户提供提供了用户访问web服务器所保留的一系列网页需一些常规的检索功能，用户可以根据信息的关键字段求，这些请求一般是 UserIP、UserID、Timestamp、进行检索或组合关键字获得所需的信息资源。但这种 Method、URL、HrrPversion、Returncode(Statusofthe 检索方式，检索到的内容复杂，大量与主题无关的信息 request)、Bytestransferred、ReferrerpageURL、Browser 被搜索，用户真正需要的信息，还需要用户自己进一步 used、Clientoperatingsystem组成。从这些信息中可以筛选，获得的信息也往往是被动的，没有考虑用户的个挖掘分析，发现用户访问服务器的行为模式、存取动性行为，不能体现用户的个人兴趣。因此，根据不同用作、停留时间等特性，其目的主要是了解 web服务器户需要提供主动的个性化信息服务已经成为Web服与用户怎样交互使用的，发现并提取具有相似访问兴务的关键问题，按照个性化信息服务模式，主要有三种趣的网络用户的浏览特征，挖掘出用户访问的浏览模形式：一是个性化推送与定制服务。即根据用户的兴式，从而进行分析并为web服务器的重组设计提供有趣偏好，采用定制的web页面、分门别类的信息导航、利信息，实现个性化信息服务。利用统计分析的方法发送E—mail等方式，把具有针对性、特色性的信息传发现用户访问兴趣浏览模式，用户访问了某一网页之输给具有特定需求的用户。二是个性化推荐与报道服后，是否也会访问其他一些与之有相对较高关联度的务。即通过智能化推荐和主动报道的途径，深入分析网页。如KITTSB[1J等提出以web服务器日志中每个用户的专业特征、研究兴趣，从而主动地向用户推荐网页的请求为处理单元，从整体的角度出发，分析评价其可能需要的信息，是一种比较深层次的信息服务方网站资源的方法。这种方法强调共性，但忽视了用户式。三是个性化知识决策服务。这种服务强调充分运作为个体的个性化。胡亚慧[]等运用改进的Markov 用知识挖掘、语义网络和人工智能等先进技术，对有模型来预测用户的浏览模式，根据用户的浏览特征实用的信息内容再进行深层次的分析与挖掘，向用户提现网站个性化服务，在 web服务器日志数据预处理收稿日期：2008—07—22 修回日期：2008—10—15 基金项目：国家自然

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于关联的聚类分析在个,陡化.PDFVIP