ds501数据科学家直通车课程大纲.pdfVIP

  • 88
  • 0
  • 约1.68万字
  • 约 14页
  • 2018-04-28 发布于天津
  • 举报
ds501数据科学家直通车课程大纲

DS501数据科学家直通车课程大纲 数据科学家直通车项目旨在帮助学员全面提升能力 ,斩获心仪的数据科学offer Phase 1: Lending Club Project 【项目介绍】 随着Fintech行业以及P2P网贷产业的快速发展,风险分析(Loan Risk Analysis )成为了网贷平台避免 投资损失,实现投资回报的重要指标之一。风险分析和预测也成为数据科学家日常工作中经典分析命 题。如何从大量的原始数据中提取有预测能力的feature ?如何基于大量的贷款数据建立模型分析每笔 贷款的interest rate ?为投资人提供高效的数据信息,将是本项目需要解决的核心问题。通过本阶段项 目,学员将亲历Data Scientist 日常工作的具体内容,模拟Lending Club内部基于贷款原始数据生成模 型。通过对feature 的理解和分析,Lending Club内部模型的模拟,新feature 的建立,对模型结果进行 分析及优化。 【学习成果】 ● 以Lending Club public data为例,详尽地学习在面试及实际工作中最需要理解掌握的知识点, 包括统计学和机器学习中起基石作用的线性回归,逻辑回归以及正则化,并能熟练运用R ● 利用真实数据,结合理论课和实战课,加深对以上知识点原理的了解和在实际问题中的应用 ● 了解data exploration ,感受Data Scientist的work routine ,包括:面对最初大量的loan申请以及 historical payment等原始数据时,应如何开展、如何理解数据,从而有效提取有predictive的 feature ,并建立模型来预测用户是否有能力偿还 ● 通过丰富的数据集,积累Fintech领域的背景知识,掌握如何处理finance和risk management数 据 Week 1 课程安排 :熟练掌握统计学基础知识以及假设检验 【学习成果】 ● 了解并掌握各种常见概率分布,如:binomial, normal, poisson, exponential, geometric binomial, etc. ● 掌握概率论重要定理,如:bayes theorem, central limit theorem and etc ● 掌握statistic inference methods, 如:parametric method and non parametric method 报名前往 :https://www.bittiger.io/  ● 了解causal inference ,和statistical inference的比较,掌握如何设计 A/B experiment来证实 causality ● 熟练掌握hypothesis testing的所有细节, 如:power, type I, II error, sample size calcualtion. ● 熟悉在面试以上知识点会以怎样的形式提问, 并可以流利回答。 ● 掌握R的使用,在R中不同的data structure ,如何分别理解categorical或numerical feature ,如 何理解feature和不同类型response之间的关系。 【理论理解】基础巩固 :统计学和假设检验 课程内容 课程要点 概率论以及应用 ● Common probability distributions and pdf/cdf ● Conditional probability, independence, bayesia

文档评论(0)

1亿VIP精品文档

相关文档