研究方法与应用模型上报-社交网络分析方法在集团成员识别中的应用.ppt

研究方法与应用模型上报-社交网络分析方法在集团成员识别中的应用.ppt

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
研究方法与应用模型上报-社交网络分析方法在集团成员识别中的应用

二、业务与技术实施方案-分析思路 分析的对象是“社交网络” 用户是社交网络中的一个结点,不同类型的用户对应不同的结点。 用户之间的联系用一条边表示,不同的通信方式对应不同类型的边。而且边是有方向的。 二、业务与技术实施方案-分析思路 利用社交网络,鉴别集团成员: 与既知集团成员有通信的用户,较可能也是成员。两者的通信量越大,这种可能性就越大。 与既知集团成员交往对象相似的用户,较可能也是成员 。两者越相似,这种可能性就越大。 二、业务与技术实施方案-模型构建 利用现有的集团成员的社交网络数据作为样本,提取成员识别规则。在社交网络,通过识别规则,进行成员归属打分。 一类联系边对应一条推理规则。 两大类联系边: 通信联系:短信收发,语音主被叫等 行为相似类:交往圈重合度,地理距离,业务使用量相似度等。 从集团成员的相关性来考虑这些联系边的设计。 推理规则的形式:(举例,假设成员占分析用户群的8%) 短信发送规则:A是成员,而且A向B发过短信,则B是成员的可能性是0.2,LIFT值为2.5。 主叫规则:A是成员,而且A主叫过B,则B是成员的可能性是0.4 交往圈重合度规则:A是成员,B与A有超过3个共同交往对象,则B是成员的可能性是0.6 推理规则实质上就是一个条件概率值。 二、业务与技术实施方案-模型构建 在社交网络中,用规则进行成员推理: 找出与用户A有联系的用户集合; 根据这些有联系用户的分数,综合各种联系边的推理规则来计算A的归属分数; 与成员联系多,而且联系规则强的用户,属于这个集团的可能性就高。 二、业务与技术实施方案-模型构建 从另一角度,可看作以集团成员为起点,沿着社交网络进行外推。推理具有传递性。 在不考虑环的情况下,成员的先验概率为1,与之直接联系的用户的归属概率就是相应规则的权重,多级联系的用户的概率很低。 强的联系,影响较远。弱的联系,影响力很快消失。 用户的最终总分是所有外推结果的叠加。 四、效益评估 模型结果处理 对选定的联系边进行训练,对获得的结果进行加权平均,得到每个结点集团归属的总概率; 对结点(用户)根据其评分进行排序,归属概率高的结点,其为实体集团成员的可能性高。 模型评估结果如下: 四、效益评估 解决的业务问题: 该集群网成员是否真正的集团实体成员? 应该推动哪些用户加入到合适的集群网中? 社会经济效益: 通过社交网络分析方法,开创性地从社交联系角度去识别用户的潜在需求; 利用社交网络分析方法,对有社交联系需求的用户进行“聚合”增加用户对集群网和移动公司的粘性,延长集团用户的生存周期; 在网络中识别出一些社交活跃度较高的“种子”成员,作为集团产品营销应用推广的基本对象。 五、经验总结 全网普及性 集团成员识别是个全网问题,由于历史原因,存在集群网成员和集团实体成员不匹配的问题,影响了移动集团品牌的市场价值。 经验及展望 业务推广:乡情网、校园网、家庭网等等; 业务优化:优化集团网成员结构,提升集团成员对集团成品的使用度和依赖度。 * 广东移动研究方法与应用模型 社交网络分析方法在集团成员识别中的应用 时间:2008年11月20日 一、研究方法与应用模型介绍 社交网络分析(Social Network Analysis, SNA)是目前数据挖掘与社会生活联系最紧密的热点之一。 在社会学中,社交网络被定义为:许多个体在不同的社会交往中(如通信/电邮/互联网等交往)中形成的网络关系。 一、研究方法与应用模型介绍 在集团成员移动通信业务中,可以通过社交网络分析的方法,研究用户的社会交往行为模式,为集团业务管理提供决策支撑; 对集群网中的用户,是否从属于同一个实体集团进行识别。 识别在集群网中的用户,哪些是集团的真实成员,哪些是虚假的集团成员; 识别未加入集群网的用户中,哪些是集团的真实成员。 移动集群网 真实集团 在网的集团成员 虚假集团成员 不在网的集团成员 短信 语音 强的双向联系 强的单向联系 没有直接联系 共同的交往圈 0.9 0.1 0.3 0.7 0.5 0.1 0.2 1 1 0.5 0 1 0.2 1 邻近用户分数 规则中的概率值 已知成员 1级 2级 3级 承前例:短信发送规则:可能性为0.2 主叫规则:可能性为0.4 交往圈重合度规则:可能性为0.6 1级联系即直接联系,2级联系即需通过一个用户 的间接联系,如此类推 三、具体应用实现案例 选定云浮市公安局为试点集团: 根据提供的通讯录,云浮市公安局的移动用户为922人; 对应的云浮市公安局集群网用户为2876人,集团真实成员只占集群网用户的32%。 三、具体应用实现案例-模型定义 社交网络结点定义: 每个用户都是社交网络中的一个结点,

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档