基于三角聚集度的社区发现标准在汽车消费人群分析探究的适用性探究.pdfVIP

  • 6
  • 0
  • 约7.45千字
  • 约 2页
  • 2019-04-12 发布于广西
  • 举报

基于三角聚集度的社区发现标准在汽车消费人群分析探究的适用性探究.pdf

技术交流 ELECTRONICS WORLD ・ 基于三角聚集度的社区发现标准在汽车消费人群分析的适用性研究 中国汽车技术研究中心 王文斌 白 辰 田 源 【摘要】 为解决汽车企业对于不同类型汽车消费人群的分析调研需求,本文研究了关系网络中消费人群的社区发现问题,根据图数 据挖掘中三角型的特性,提出基于三角聚集度的社区发现标准。研究发现该方法对于车企的消费人群划分判别具有很好的适用性。 【关键词】 汽车消费人群分析;社区发现;三角聚集度 义和价值。因为三角形存在两个重要特性——同质和传递,这 1 引言 两个性质在社交网络的图数据挖掘中就起到了跟重要的作用: 社交网络的用户倾向于与有用相似爱好和兴趣的人建立朋友关 近年来,随着网络和各种电子设备的日益普及,越来越多人 系 (在数据的角度,用户之间拥有相似的三角形模式),这种 都参与到互联网的信息交流中去。在众多的网站中,Twitter 、Face- 倾向性在社交网络中,主要表现在用户更愿意与拥有相同朋友 book、微博、人人网、以及微信朋友圈等一系列社交网络作为近年来 圈子的人成为朋友。同时,统计三角形也被应用于挖掘隐藏的 广泛使用的交流平台,如雨后春笋般纷纷涌现出来,面向各个领域 网页主题、彭谷聚类参数, 以及检测垃圾邮件。 拓展自己的用户。而那些现实生活中的人们因为各自的兴趣爱好、 3.2 聚集系数 [3] 地理位置、工作性质等原因所组成不同的“真实”群体,如何在这 其实最早在1949年R. D. Luce和A. D. Perry的一篇论文 中,图中三 一 “虚拟”的社交网络中将其群体 (或称其为 “社区”)标注提取 角形的聚集度已经在图论中被提出并定义这一系数为图的聚集系数, 出来,并挖掘这些群体的共同特点,发现知识、创造价值,已经成 描述的是图中的若干点倾向于集聚在一起的程度的一种度量。 为社交网络数据挖掘领域的一项研究热点, “社区发现”作为一个 而图中的某一个节点,聚集系数表示了它相连的点抱成团 新兴的研究领域,也就因此成为研究者广泛关注的问题。 (完全子图)的程度。为方便说明,这里定义在G (V, E) 中 包含一系列节点V和连接它们的边E 。 表示 2 社区发现 的第i个相邻节点。 表示 的相邻节点的数量。一个顶点 的 聚集系数 等于所有与它相连的顶点之间所连的边的数量,除 社交网络反映了现实生活中的这样一个特点:人们都会因 以这些顶点之间可以连出的最大边数。在无向图中的最大边数 为各自的兴趣爱好,或所在地理位置、工作性质等原因而形成 为 ,所以某一点的聚集系数公式表示为: 各种各样的群体。而在社交网络中,这些群体都会因为彼此的 熟识或共同关注了某人或某物而有着较其他陌生人相比,更为 频繁的交流。那么利用这种关系,是否可以在社交平台中复杂 那么整个网络的所有点聚集系数就可以定义为所有节点n 的 而庞大的用户

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档