河南公司垃圾短信治理工作介绍.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
河南公司垃圾短信治理工作介绍

在网时长=2月用户采用逻辑回归预测模型,共使用24个指标,生成逻辑回归计算公式。 也就是说,我们将用户的各项指标输入,将通过公式计算出每个号码将要发送垃圾短信的一个倾向值,分值越高,说明嫌疑越大。 * 目前对于什么是群发器,还没有一个很明确的定义。根据对业务的理解,我们认为群发器就是“在同一位置,利用多个号码,同时发送垃圾短信”。群发器的识别模型的建立就是从4各特性出发,在确认了发送垃圾短信号码的基础上,确认群发器所在小区位置。 * 群发器的建模过程可以分为三大步,总的来说就是业务知识与技术手段相结合。 * 技术手段是由两个步骤来完成的。通过分析,最终我们选择了4个指标来识别群发器。 以当天高峰时段发送对端号码前8位连号占比为例,按该指标将同一位置上的用户聚成3类,然后通过决策树确定其分类边界,从而区分各指标上的重度、中度、轻度用户。 * 第*页 河南公司依托经营分析系统支撑垃圾短信治理工作介绍 2011年4月 目 录 建设情况 应用效果 下步工作 一、现状及问题:垃圾短信发送手段多样化给治理工作带来严峻挑战 以低频发送代替高频发送 群发器发送影响面积较大 谐音和字符间隔逃避拦截 由涉黄涉黑转向广告宣传 内容隐蔽 手段多样 信息安 全担忧 客户满意度降低 随着垃圾短信打击力度的不断加强,垃圾短信发送的内容趋向隐蔽化、手段趋向多样化,简单地利用关键字、短信条数限制等手段已经不能满足治理需求,需要进一步加强垃圾短信息治理工作的支撑。 2010年9月11日至17日一周内确认的垃圾短信号码有4517个,其中约30%即1317个是通过举报确认的。 2010年1-5月客服中心经人工审核数据368797条,其中误拦进入人工审核环节量高达96.95% 。 10年2月20日至26日一周内进入人工审核的平均号码数为574,其中约有30%当天没能经过人工审核。 问 题 现 状 投诉压 力增大 舆论压 力增大 目前只有针对垃圾短信发送的拦截机制,需要进一步加强群发器治理、资费和渠道管理等源头治理工作。 漏拦号码量大 误拦 信息严重 人工压力大 源头治理不足 同一位置 多个号码 同时发送 垃圾短信 二、解决方案(模型):依托经分系统构建垃圾短信识别模型打造垃圾短信综合治理体系完善垃圾短信治理机制 垃圾短信预测模型 群发器识别模型 在网=2月用户 在网 2月用户 逻辑回归预测模型 决策树 预测模型 在确认垃圾短信的基础上 STP1:从基本属性、短信行为、通话行为、费用行为四个维度出发,共设计93个指标 STP2:经过特征建模分析、双变量分析、相关和自相关分析等方法筛选建模指标变量后,剩余65个建模指标 STP3:通过建模算法计算每个用户可能发送垃圾短信的倾向值得分,分值越大风险越高 STP1:从业务知识入手,确认发送短信集中位置 STP2:运用技术手段细分嫌疑用户 STP3:回归业务知识,最终筛选疑似群发器清单,确定疑似群发器所在小区位置 经分系统垃圾短信识别模型 解决方案(应用):联合相关部门建立垃圾短信拦截工作机制,实现分级分层拦截,提升拦截效果 替代原模型高危用户,对全网用户进行分级分层监控 高风险用户:设置高风险用户黑名单门限和高风险用户灰名单门限 普通用户:设置大众化拦截门限 依托经分系统,为网管中心短信监控系统提供各类型用户名单 分级:区分高风险用户和普通用户 分层:对于高风险用户设置黑名单拦截门限和灰名单拦截门限 同一位置 多个号码 同时发送 垃圾短信 三、整体框架:以垃圾短信预测模型及群发器识别模型为抓手,完善垃圾短信治理机制,强化经分系统支撑能力 打造垃圾短信综合治理体系 完善垃圾短信治理机制 垃圾短信预测模型 群发器识别模型 数据 准备 数据 抽取 数据挖掘宽表 短信集中位置信息表 在网=2月用户 在网 2月用户 逻辑回归预测模型 决策树 预测模型 基本属性 日短信行为 月短信行为 上月通信行为 当天短信行为 …… 在预测并确认垃圾短信号码的基础上,构建群发器识别模型 发送短信量、回复短信量、短信回复率 发送短信对端人数、回复短信人数、人数回复率 省内、省外号码分布条数、占比 省内、省外号码分布人数 短信分布集中时段 集中时段短信数量 集中时段对端人数 集中时段人均发送量 集中时段9位连号最大值 集中时段8位连号最大值 集中时段7位连号最大值 集中时段9位连号总和、占比 集中时段8位连号总和、占比 集中时段7连号位总和、占比 三天内集中时段个数 三天内集中时段分布天数 短信行为(52) 垃圾短信用户识别指标体系(93) 基本属性(7) 年龄 性别 地区 入网时长 入网渠道 品牌 套餐包含短信数 主叫时长 被叫通话时长 主叫通话时长占比 被叫通话时长占比 主叫次数 被叫次数 发送短信数量 接收短信人数

文档评论(0)

shujukd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档