- 88
- 0
- 约1.68万字
- 约 14页
- 2018-04-28 发布于天津
- 举报
ds501数据科学家直通车课程大纲
DS501数据科学家直通车课程大纲
数据科学家直通车项目旨在帮助学员全面提升能力 ,斩获心仪的数据科学offer
Phase 1: Lending Club Project
【项目介绍】
随着Fintech行业以及P2P网贷产业的快速发展,风险分析(Loan Risk Analysis )成为了网贷平台避免
投资损失,实现投资回报的重要指标之一。风险分析和预测也成为数据科学家日常工作中经典分析命
题。如何从大量的原始数据中提取有预测能力的feature ?如何基于大量的贷款数据建立模型分析每笔
贷款的interest rate ?为投资人提供高效的数据信息,将是本项目需要解决的核心问题。通过本阶段项
目,学员将亲历Data Scientist 日常工作的具体内容,模拟Lending Club内部基于贷款原始数据生成模
型。通过对feature 的理解和分析,Lending Club内部模型的模拟,新feature 的建立,对模型结果进行
分析及优化。
【学习成果】
● 以Lending Club public data为例,详尽地学习在面试及实际工作中最需要理解掌握的知识点,
包括统计学和机器学习中起基石作用的线性回归,逻辑回归以及正则化,并能熟练运用R
● 利用真实数据,结合理论课和实战课,加深对以上知识点原理的了解和在实际问题中的应用
● 了解data exploration ,感受Data Scientist的work routine ,包括:面对最初大量的loan申请以及
historical payment等原始数据时,应如何开展、如何理解数据,从而有效提取有predictive的
feature ,并建立模型来预测用户是否有能力偿还
● 通过丰富的数据集,积累Fintech领域的背景知识,掌握如何处理finance和risk management数
据
Week 1 课程安排 :熟练掌握统计学基础知识以及假设检验
【学习成果】
● 了解并掌握各种常见概率分布,如:binomial, normal, poisson, exponential, geometric
binomial, etc.
● 掌握概率论重要定理,如:bayes theorem, central limit theorem and etc
● 掌握statistic inference methods, 如:parametric method and non parametric method
报名前往 :https://www.bittiger.io/
● 了解causal inference ,和statistical inference的比较,掌握如何设计 A/B experiment来证实
causality
● 熟练掌握hypothesis testing的所有细节, 如:power, type I, II error, sample size calcualtion.
● 熟悉在面试以上知识点会以怎样的形式提问, 并可以流利回答。
● 掌握R的使用,在R中不同的data structure ,如何分别理解categorical或numerical feature ,如
何理解feature和不同类型response之间的关系。
【理论理解】基础巩固 :统计学和假设检验
课程内容 课程要点
概率论以及应用 ● Common probability distributions and pdf/cdf
● Conditional probability, independence, bayesia
您可能关注的文档
最近下载
- 小学数学教学中数学建模思想与生活问题解决课题报告教学研究课题报告.docx
- 中国糖尿病防治指南(2024版)解读-糖尿病相关技术.pptx
- 建筑工程中途退出协议书.doc VIP
- 勾股定理.1勾股定理课件.ppt VIP
- 结直肠癌放疗护理常规.pptx VIP
- 前臂的挤压伤查房.pptx VIP
- 2025至2030中国匹克球市场前景预判与未来发展形势分析报告.docx VIP
- 2026-2030中国匹克球市场前景预判与未来发展形势分析研究报告.docx
- 2025至2030中国匹克球市场前景预判与未来发展形势分析报告.docx VIP
- 4-1输变电工程施工质量验收统一表式(电缆工程电气专业)-2024年版.docx
原创力文档

文档评论(0)