- 9
- 0
- 约7.61千字
- 约 29页
- 2019-03-09 发布于湖北
- 举报
金融市场的数据挖掘 教材: 数据采掘入门与应用 张尧庭编 中国统计出版社 参考教材: 1、数据挖掘——概念与技术 jiawei Han著,范明译 机械工业出版社 2、多元统计数据分析——理论、方法、实例 任若恩著 国防工业出版社 配套应用软件: 1、Intelligent miner for data 2、SAS 第一章:概论 一、何为数据挖掘(data mining) 现代信息社会的特征:信息(数据)泛滥、知识缺乏,如何从海量数据(广义的概念)中挖掘出决策有用信息? 数据挖掘是结合现代数学、统计学,机器学习、人工智能、数据库管理、计算机图形学、软件工程等各领域的技术和知识,1990年代在西方国家出现的一种高新技术——从海量数据中挖掘出决策有用信息的技术。 1990年代末,在对100名美国著名科学家的问卷调查中,数据挖掘被列为21世纪对人类发展影响最大、最有前途的10大技术的第三位。 我国对数据挖掘技术的重视(开发与应用) 1、863、963项目; 2、国家及省重点科学领域; 3、国家统计局在全国组织数据挖掘培训(2000); 4、企业特别是银行对数据挖掘技术的重视; 5、人民大学数据挖掘研究与应用中心。 海量数据——沙漠,隐含的知识——金子, 数据挖掘——从沙漠中挖掘金子的技术。 二、不同学科对数据挖掘技术的研究与开发 1、理论研究——各种数据挖掘技术的理论基础、理论依据研究,从数学、统计学、人工智能、计算机图形学等不同领域; 2、挖掘技术研究,从统计学、人工智能、机器学习、计算机图形学、软件工程等领域; 3、数据管理策略研究,从数据库管理技术等领域; 4、数据挖掘技术的应用研究,其中数据挖掘技术在金融领域的应用是一个重要方面。 三、几种相对比较成熟的数据挖掘技术 数据挖掘是一门新兴的、正在不断发展中的技术,近年来,几类十分重要、且相对比较成熟的数据挖掘技术是: 1、分类与预测 2、特征化、比较与关联规则挖掘 3、聚类分析 4、序列发现 本课程主要内容:几类数据挖掘技术的基本原理、数据挖掘方法、及这些挖掘技术在金融领域的应用。 第二章:分类与预测 一、分类与预测的概念 1、分类 已知离散的、有限的几个类,判断或预测样本属于那个类。 * 某人否具有某种疾病 * 上市公司是否会陷入财务困境、是否会被外资并购 * 借款人是否会违约 * 这个客户是否为银行的潜在优质客户、是否会转向其他银行 用y表示类变量,y取离散的几个值,分类就是判断或预测样本的y究竟取什么值 2、预测 预测是指对连续性变量的取值进行预测,如: * 某个借款人的违约概率是多少 * 银行资产组合明天在99%置信度下的最大损失(VaR)有 多大 * 如果某开放式基金因面临巨额赎回申请而不得不大量抛售某种证券,这种证券的价格会下跌多少 分类——对离散型变量进行预测 预测——对连续型变量进行预测 二、分类案例教学—— 上市公司财务困境预测模型构建 1、要求: 将因财务状况异常而被特别处理的ST公司界定为财务困境公司、非ST公司界定为财务正常公司,利用上市公司的财务报表数据,建立上市公司财务困境预测模型(提前一年预测,即用第t-2年的数据预测企业在第t年是否会陷入财务困境)。 分类变量y的取值 y=0 如果公司为财务困境公司
您可能关注的文档
最近下载
- 南京信息工程大学艺术类创作作品转换科研成果办法修订.docx VIP
- 日本横河WT210230说明书.pdf VIP
- AE-5M-3040GC5035CSPdatasheetre(1)_电子版高清文档.pdf VIP
- 个人优势与劣势分析.pptx VIP
- 通力GFS25载货电梯调试培训.pdf
- 在美国课税与申报目的下之最终受益人身分证明一法人.PDF VIP
- 山东省实验中学2024-2025学年高二上学期1月期末数学试题(含答案解析).docx
- 专题04 《物态变化》压轴培优题型训练【十三大题型】(解析版)2023-2024学年八年级上册《物理》培优专题训练(人教版).docx VIP
- 柱体绕流阻力理论研究和数值模拟.docx VIP
- 湖北省宜昌市夷陵区2024-2025学年八年级上学期期末考试物理试题【含答案】.pdf VIP
原创力文档

文档评论(0)