基于聚类挖掘技术在电子商务网站中应用.pdfVIP

  • 1
  • 0
  • 约8.28千字
  • 约 3页
  • 2017-11-03 发布于湖北
  • 举报

基于聚类挖掘技术在电子商务网站中应用.pdf

ISSN1009-3044 E-mail:wyl@ 第10卷第5期 (2014年2月) ComputerKnowledgeandTechnology电脑知识与技术 ComputerKnowledgeandTechnology 电脑知识与技术 Vol.10,No.5,February2014 Tel:+86-55165690964 基于聚类挖掘技术在电子商务网站中的应用 李 斌 (湖南高速铁路职业技术学院铁道电信系,湖南衡阳421001) 摘要:数据挖掘技术是一种新的信息处理技术。其目的是从海量数据中抽取潜在的,有价值的数据规律或数据模型。通 过数据挖掘技术对电子商务网站数据的分析处理,结合客户关系管理策略,建立反映客户个性特征的客户特征模型,建立 动态适应性的服务机制,有效地为不同类型的客户进行个性化服务。该文主要将聚类技术应用到电子商务网站,通过建 立商品数据库,利用频繁项集的方法得到客户聚类向量,计算出客户的相异度矩阵,用聚类技术实现客户的分类。 关键词:数据挖掘;客户特征;聚类技术 中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)05-1147-03 1聚类分析算法的简述 聚类分析(ClusterAnalysis)是数理统计中专门研究“物以类聚”的一种方法,它具有以下三个要点:选定某种距离度量作为样 本间的相似性度量;确定某个评价聚类结果的准则函数;给定某个初始分类,然后用迭代算法找出使准则函数取极值的最好聚类 [32] 结果。关于数据挖掘中的聚类算法有很多种 ,其中最经典的就是属于划分方法的K-means(K-平均值)的算法。 2聚类分析算法的数据类型 聚类算法通常都采用以下两种数据结构 1)数据矩阵:这种数据结构是关系表的形式,用p个变量(属性)来表现n个对象,可以看成n×p(n个对象×p个变量)的矩阵 éx ⋯x ⋯x ù ê 11 1f 1p ú êê⋮⋯⋮⋯. ⋮úú êx ⋯x ⋯.xif ip ú ê i1 ú êê⋮⋯⋮⋯⋮ úú ê ú x ⋯x ⋯.x ë n1 nf npû 2)相异度矩阵:或称对象-对象结构,存储n个对象两两之间的近似性,表现形式是一个n×p的矩阵。 é0 ù êêd(2,1)0 úú

文档评论(0)

1亿VIP精品文档

相关文档