量化投资中要用到的数学.pdf

量化投资中要用到的数学 MIT 一牛人对数学在机器学习中的作用给的评述,写得 很实际机器学习和计算机视觉都是很多种数学的交汇场。看 着不同的理论体系的交汇, 对于一个 researcher 来说, 往往 是非常 exciting 的 enjoyable 的事情。不过,这也代表着要 充分了解这个领域并且取得有意义的进展是很艰苦的。 Linear Algebra ( 线性代数 ) 和 Statistics ( 统计学 ) 是最重要 和不可缺少的。 这代表了 Machine Learning 中最主流的两大 类方法的基础。一种是以研究函数和变换为重点的代数方法, 比如 Dimension reduction ,feature extraction ,Kernel 等, 一种是以研究统计模型和样本分布为重点的统计方法,比如 Graphical model, Information theoretical models 等。它们 侧重虽有不同,但是常常是共同使用的,对于代数方法,往 往需要统计上的解释,对于统计模型,其具体计算则需要代 数的帮助。以代数和统计为出发点,继续往深处走,我们会 发现需要更多的数学。 Calculus ( 微积分 ),只是数学分析体 系的基础。其基础性作用不言而喻。 Learning 研究的大部分 问题是在连续的度量空间进行的,无论代数还是统计,在研 究优化问题的时候,对一个映射的微分或者梯度的分析总是 不可避免。而在统计学中, Marginalization 和积分更是密不 可分——不过,以解析形式把积分导出来的情况则不多见。 Partial Differential Equation (偏微分方程 ),这主要用于描 述动态过程, 或者仿动态过程。 这个学科在 Vision 中用得比 Learning 多,主要用于描述连续场的运动或者扩散过程。比 如 Level set, Optical flow 都是这方面的典型例子。 Functional Analysis ( 泛函分析 ) ,通俗地,可以理解为微积 分从有限维空间到无限维空间的拓展——当然了,它实际上 远不止于此。在这个地方,函数以及其所作用的对象之间存 在的对偶关系扮演了非常重要的角色。 Learning 发展至今, 也在向无限维延伸——从研究有限维向量的问题到以无限 维的函数为研究对象。 Kernel Learning 和 Gaussian Process 是其中典型的例子——其中的核心概念都是 Kernel 。很多做 Learning 的人把 Kernel 简单理解为 Kernel trick 的运用,这就把 kernel 的意义严重弱化了。 在泛函里面, Kernel (Inner Product) 是建立整个博大的代数体系的根本, 从 metric, transform 到 spectrum 都根源于此。 Measure Theory ( 测度理论 ),这是和实分析关系非常密切的学科。但 是测度理论并不限于此。 从某种意义上说, Real Analysis 可 以从 Lebesgue Measure (勒贝格测度)推演,不过其实还 有很多别的测度体系——概率本身就是一种测度。测度理论 对于 Learning 的意义是根本的, 现代统计学整个就是建立在 测度理论的基础之上——虽然初级的概率论教科书一般不 这样引入。 在看一些统计方面的文章的时候,

文档评论(0)

1亿VIP精品文档

相关文档