基于大数据分析的实时风控体系解决方案(风控大数据)课件.pptVIP

基于大数据分析的实时风控体系解决方案(风控大数据)课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
风控模型和策 略 特征工程 ? 单人游 下单和起飞时间之间的天数 ? 手机和 ID 与 A D city 是否冲突 ? 保费,订单金额 家庭游 ? 常旅客卡 ? 订单金额 ? 往返航班 好友游 ? 航班类型 ? 国内国外游 情侣游 ? 持卡人非出行人 ? 是否同省 3% 2.2.2% 20.1% 5.0% 56.9% 国内因公 单人游 家庭游 风控模型和策 略 文本信号挖掘 文本 文 本 处 理 词性标注 分词 去字尾 过滤 N 元组语义 分析 NL P / 文 本 分 析 技 术 语音识别 ? 声波数据 预处 理 ? 音 频 采 样 ? 分解 频带 ? 傅立叶 变换创 建 识别码 ? RNN 识别 音 频 片段字符 ? 文本数据 对 深度学 习发 音 预测矫 正 : 词汇库 ? 开 发词 / 词组库 ,并关 联 到 相关主 题 和目 标 ? 考 虑 同 义 / 下位 词 ? 使用 : ? 对 特定目 标识别问题 焦 点 ? 为 模型特征工程做 预备 实体识别 ? 识别 特殊 实 体 类别 ,如人 名,地点, 时间 , 问题类别 , 关 键 名 词 ? 使用 : ? 识别 特定种 类实 体 ? 对 特定 实 体 对 相关 词组 分 组 基于文本模型 ? 统计 分析 对 特定目 标 字 词 的相关性 ? 根据 标签 的可用性 应 用 业 界最新的无 监 督或有 监 督 算法 ? 使用 : ? 模型特征 库 萃取 风控模型和策 略 字母生成概率 变量注释 变量名 26 个字母 +10 个数字 + 特殊字符频率 freq_ 域名欺诈率 domain_degree 名字模式欺诈率 name_degree 正常名字模式生成可能概率 name_probability 名字复杂度 num_change 名字长度 length 生成概率(数字转移数字概率不为 prob_prefix_num_no_1 1 ) 生成概率(数字转移数字概率为 1 ) prob_prefix_num_1 生成概率(只有字母) prob_prefix_alp 原 始 数据去重 建 模 提取特征值 train 数 数 data 据 据 原 始 数据去重 测 试 提取特征值 数 数 据 据 风控模型和策略 模型工厂 数据源获取 平台加工 信号侦测 预测分析 数据管理和集成 应用 评 估 项 目状 态 项 目状 态 项 目状 态 项 目状 态 项 目状 态 ? 传统数据库 基 本 原 理 +NoSQL 保证 ETL 速度 ? 多重数据仓库集 ? 自动生成各产线 ? 变量衍生和特征 ? 支持快速开发定 模型报警 成 制特定算法 工程 ? 使用携程独创 学习算法处理非 Ageis 系统高效获 结构化数据 取和存储建模所 需数据 ? 密切监测模型运 ? 深度学习及机器 ? 线上自适应调整 行情况 模型参数 ? 实时 / 离线模型表 现业务监控报表 ? 快速部署支持数 亿交易量的业务 ? 实时查看模型变 量和模型评分分 布 初始 中间 完工 风控模型和策略 模型生命周期 模型优化 生产系统 模型部署 奇异值分析 模型监控 模型调整 模型评估 数 据 集 成 数据仓库 ETL 建模数据 衍生变量 抽样 模 分箱 型 模型训练 开 变形转换 发 稀疏格式转 换 其它数据源 数据准备 风控模型和策略 基于统计分析 机器学习的欺诈策略 欺诈交易识别分二步 : 1. 欺诈特征生成; 2. 机器学习模式识别 欺诈特征 ? Velocity – E.g. 2 连续交 易发生在很多时间内 模型 评分 ? 利用传统模型方法如逻辑回归,神经网络,矩阵 因子分解, K 最近邻法等 – Matrix Factorization High Risk ? Distance to home – E.

文档评论(0)

精品大课件 + 关注
实名认证
文档贡献者

专业类课件,PPT课件,ppt课件,专业类Word文档。只为能提供更有价值的文档。

1亿VIP精品文档

相关文档