- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
商业银行内审技术和方法
目录
商业银行内审技术
商业银行内审方法
案例
1
2
3
1.1商业银行内审技术的变革
1、大数据、云计算和互联网的发展
大数据
云计算
互联网
2、银行全面电子数据化
金融产品数据化
金融服务数据化
业务流程数据化
3、现场审计和非现场审计技术逐步融合
非现场审计不仅作为现场审计的抽样工具,现场审计阶段也需要通过计算机辅助工具获得信息,现场审计和非现场审计的边界越来越模糊
即使信息技术非常发达,现实世界仍有部分信息不能被数据化,非现场审计不能完全替代现场审计
1.2 审计数据采集处理技术
随着我们所获取的数据变得越来越庞大,我们也正在逐步逼近全体数据,数据获得的边界便是审计的边界。
1.2数据采集处理技术
1.2 数据采集技术
内部数据VS外部数据
结构化数据vs非结构化数据
数据分类:
内部数据vs外部数据
内部数据:目前银行内部数据主要是联机交易数据和联机分析数据, 是最主要的数据,包括:
报表
传票
客户账户和交易
合同或协议
机构、渠道和产品
业务运营
业务审批
业务档案
客户之声反馈数据
外部数据:
人行征信
工商登记
法院、环保
第三方支付
海关、税务
WIND
第三方公司风险数据集成
互联网爬虫
……
结构化数据VS非结构化数据
结构化数据
会计报表
客户结算
业务台帐
….
非结构化数据
监控录像
客户之声
信贷档案
会计影像
贷款审批意见
…
1.3 审计检查分析技术
1、业务场景、流程还原
2、风险数据、审计经验历史积累
3、可视化SQL技术
4、数据挖掘技术
1.3.1业务场景、流程还原
客户视图
机构、渠道视图
产品视图
贷款视图
账户视图
……
业务场景举例:客户视图
业务场景举例:客户视图
业务系统数据
客户基本
产品信息
账户信息
交易信息
……
企业内外大数据
微博信息
社交网站流量日志
音频视频
……
传统客户画像数据仅仅来自业务系统,事件信息、关系信息、等多类信息缺失或不足,很难形成准确、全方位的画像。引入大数据,实现了客户360o立体画像
客户视图举例-业务流程和信贷档案
审计业务
流程举例
审计业务流程举例
客户视图举例-具体交易
审计业务
流程举例
审计业务
流程举例
1.3.2 风险信息、审计经验历史积累
1.3.3可视化SQL技术
数据分类
1.3.3可视化SQL技术
17
功能演示
1.3.4 数据挖掘技术
审计常用数据挖掘技术
一般统计技术
聚类
相关
分类
Benford定律
1.3.4.1.一般统计方法
19
19
频数分析
集中趋势
均值、中位数
离散程度
方差、标准差
分布状态
偏度、峰度
1
2
3
4
平均值:95
中位数:55
数据之间差异大,存在个别极端值时,用中位数
衡量数据之间的差异程度,如最大和最小值差距多少。
方差和标准差:
每个数据与其均值相比平均相差多少
是否符合正态分布
峰度:描述分布形态的陡缓程度
偏度:描述图像尾部的相对长度
数值
频数
20
101
30
122
40
230
50
301
60
242
70
140
80
97
*
*
*
*
*
*
*
*
*
*
*
中位数 平均值
1.3.4.2 聚类
在数据挖掘中,“聚类分析”基于“物以类聚,人以群分”的朴素思想,根据数据特征属性对数据样本进行区分。尤其当不知道数据样本所带标签时,可以使用聚类技术促使带同类标签的数据与其他标签的数据相分离。
在聚类分析中,类别中样本的相似性越大,类别间样本的差别越大,聚类的效果就越好。
在聚类分析中,如果一个对象不强属于任何类,那么该对象是基于聚类的离群点。
1.3.4.3相关性分析
使用目的:研究变量或事物之间是否有关系以及关系密切程度
衡量方式:相关系数
21
1.3.4.4 分类
“分类”所要解决的问题是为一个数据对象归类,即确定一个特定的对象属于哪一类别。分类工作的任务就是要构建一个分类模型(或称:分类器)。分类技术和回归技术均可用于预测,分类的输出是离散的类别值,而回归的输出是连续数值。
分类模型是通过对那些已知的历史数据学习(或训练)出来的。
这里用于建立模型的数据称为学习(训练)集,通常是已经掌握历史数据。
在学习(训练)集中每个对象都赋予一个类别的标记,不同的类别具有不同的标记,如“违约”和“不违约”。因此,在已知客户是否违约、是否流失等类标的情况下,通常采用分类数据挖掘方法对客户数据进行分析。
1.3.4.4 分类
决策树
Logistic回归模型
审计常用技术
24
1.3.4.5 Benford定律
概念
所有自然随机变量,只要样本空
文档评论(0)