机器学习数据回归.pptVIP

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习数据回归

* * * * * * * * * * * * * * * * * * * * * 中国科学院大学 叶齐祥 qxye@ucas.ac.cn 第2.1节 数据回归 Data regression 主要内容: 线性回归 线性回归 局部加权的线性回归 非线性回归 带有非线性基的回归 欠拟合与过拟合 Logistic 回归 数据回归介绍 例子 假如你刚刚搬到学校,需要知道在你学校周围的房价,设计一个数据回归程序。 距离学校的距离 卧室数目 房租 2.30km 1 1600 5.06km 2 2000 4.33km 2 2100 1.09km 1 1500 … 1.50km 1 ? 2.70km 1.5 ? 例子 假如你刚刚搬到学校,需要知道在你学校周围的房价,设计一个数据回归程序。 距离 房 租 1.0/距离 房间 房 租 数据回归介绍 问题描述 特征: 居住面积、房间数、距离… 训练集合 回归目标 数据回归介绍 Training set Learning algorithm X h y 房价 假设目标(Y)是特征的线性方程 如何求取参数 直观的方法是最小化 线性回归 目标方程 梯度方法求解 获得梯度下降迭代 线性回归—最小均方差(LMS)求解 目标方程 Steepest下降方法求解 获得Steepest decent迭代 线性回归—最小均方差(LMS)求解 线性回归—梯度下降(Gradient descend)求解 假如目标值与输入之间的关系为 其中 表示符合正态分布的随机噪声 做样本独立性假设,得到 线性回归—概率角度理解LMS 计算Log似然 上式第二项即是LMS 结论:求最小均方差LMS和极大似然估计MLE是等效的 线性回归—概率角度理解LMS 主要内容: 线性回归 线性回归 欠拟合与过拟合 局部加权的线性回归 非线性回归 带有非线性基的回归 欠拟合与过拟合 Logistic 回归 加权 原来的目标函数: 加权函数: 权值: 其中X靠近测量值或者测量值均值变量 线性回归—局部加权 主要内容: 线性回归 线性回归 局部加权的线性回归 非线性回归 带有非线性基的回归 欠拟合与过拟合 Logistic 回归 设计出非线性特性 其中 是基,例如 非线性回归—非线性基 多项式: RBF: Sigmod: 1D RBF 拟合后 回归—1D and 2D RBFs Good 2D RBF Bad 2D RBF 回归—1D and 2D RBFs Good 2D RBF Bad 2D RBF 回归—1D and 2D RBFs 主要内容: 线性回归 线性回归 局部加权的线性回归 非线性回归 带有非线性基的回归 欠拟合与过拟合 Logistic 回归 欠拟合与过拟合 数据回归—欠拟合与过拟合 主要内容: 线性回归 线性回归 局部加权的线性回归 非线性回归 带有非线性基的回归 欠拟合与过拟合 Logistic 回归 回归分析可用来分析一个/多个自变量与一个因变量的关系,模型中因变量Y是边连续性随机变量,并要求呈正态分布。 但在医学研究中,常碰到因变量的取值仅有两个,如药物实验中,动物出现死亡或生存,P和X的关系显然不能用一般线性回归模型P=B0+B1X来表示。这时可用Logistic回归分析。 Logistic 回归 Logistic 回归 先引入Logistic分布函数,表达式为: X的取值在正负无穷大之间;F(x)则在0-1之间取值,并呈单调上升S型曲线。人们正是利用Logistic分布函数这一特征,将其应用到例如: 临床医学和流行病学中来描述事件发生的概率。 例子:以因变量Y=1表示死亡, Y =0表示生存,以P(Y =1|X)表示使用药物剂量X的动物死亡的概率,设 记Logit(P)=ln[p/(1-p)],则上式可表示为: 这里X的取值仍是任意的, Logit(P)的值亦在正负无穷大之间,概率P的数值则必然在0-1之间。 p/(1-p)为事件的优势, Logit(P)为对数优势,故logistic回归又称对数优势线性回归 Logistic 回归 Logistic 回归 一般地,设某事件Y发生(Y=1)的概率P依赖于多个自变量(x1,x2, …,xp),且 或者 则称该事件发生的概率与变量间关系符合多元Logistic回归或对数优势线性回归。 优势比(odds ratio, OR): 某个自变量Xj 改变一个单位,造成的后验概率

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档