教材配套教学PPT——时间序列和基于Web的数据挖掘.PPT

教材配套教学PPT——时间序列和基于Web的数据挖掘.PPT

教材配套教学PPT——时间序列和基于Web的数据挖掘

第二次迭代的计算结果 计算两簇之间相似度值的方法——计算两个簇中所有实例平均相似度。 * 第*页,共40页 表8.5 凝聚聚类的第二次迭代的相似性值计算结果 相似性值 ( , ) ( , ) 1 0.609 0.727 0.64 0.609 1 0.27 0.27 0.727 0.27 1 0.36 0.64 0.27 0.36 1 产生两个单实例簇( ),( )和一个三实例簇( 、 、 )。 继续簇的合并过程直到所有实例合并到一个簇中。 8.2.3 Web使用挖掘 2、Web站点评估 使用Web日志数据挖掘的目标 (1)网站评估。 (2)个性化服务。 序列挖掘器(Sequence Miner) 关注页面的浏览顺序,从而发现最好的链接顺序。 此时的基于Web日志的数据挖掘问题成为了序列识别问题,这类问题使用序列挖掘器算法来解决。 * 第*页,共40页 8.2.3 Web使用挖掘 3、个性化服务 基于Web日志的数据挖掘的另一方面目标—— 提供个性化服务(Personalization Service)。 * 第*页,共40页 图8.12 基于Web日志的个性化服务模型建立过程 8.2.3 Web使用挖掘 使用关联分析和聚类技术产生关联规则或簇,建立用户访问Web站点的使用特征文件(Usage Profiles,UP),使用UP

文档评论(0)

1亿VIP精品文档

相关文档