- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
2.4实践任务任务1认识线性回归任务2准备数据任务3设计模型任务4训练模型任务5预测数据
任务1认识线性回归线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
任务1认识线性回归线性回归属于回归算法,表达监督学习的过程。通过属性的线性组合来预测函数,其线性模型基本形式为:一般向量形式写成:其中w=(w1;w2;…;wd)。w1;w2;…;wd为模型训练数据中学习到的参数,或赋予每个变量的“权值”。b也是一个学习到的参数,这个线性函数中的常量也称为模型的偏置。
任务2准备数据为了更好地理解前面所讲的概念,本节将引入一个案例:根据程序员的编程代码量来预测其编程水平测试的成绩。我们将实现一个线性回归模型,并用梯度下降算法求解该模型,从而给出预测直线。这个实例问题是:假如有历史编程代码量和成绩的数据,我们应如何预测未来某个程序员的编程水平成绩呢?针对这个问题,我们的求解步骤包括:准备数据、设计模型、训练和预测。
任务2准备数据首先,我们编造一批代码量的数据。代码量数据就可以为0,1,2,3…,每个数表示以百行为单位,例如3表示300行代码量
任务2准备数据我们可以用PyTorch的linspace来构造0~100之间的均匀数字作为代码量的变量x:
任务2准备数据然后,我们生成对应的编程成绩数据,假设它就是在x的基础上加上一定的噪声,实现代码如下:
任务2准备数据这样我们就构造了一个数据集,x表示代码量,y表示编程水平成绩。在这100个不同的代码量????和每一个成绩????对应,其中,每个????,????称为一个样本点。
任务2准备数据下面,我们将数据集切分成训练集和测试集两部分。
任务2准备数据接下来,我们对训练数据点进行可视化:图2.19模拟编程水平数据集的散点图
任务3设计模型并让它尽可能地小。
任务3设计模型?
任务3设计模型在计算的过程中,我们需要计算出??对??、??的偏导数,利用PyTorch的:backward()可以非常方便地将这两个偏导数计算出来。
任务4训练模型我们将上述思路转化为PyTorch代码。首先,我们需要定义两个自动微分变量a和b:
任务4训练模型设置学习率:learning_rate=0.0001然后,完成对a和b的迭代计算:
任务4训练模型另外,有几点技术细节值得说明。在计算predictions时,为了让a、b与x的维度相匹配,我们对a和b进行了扩维。PyTorch规定,不能直接对自动微分变量进行数值更新,只能对它的data属性进行更新。所以在更新a的时候,我们是在更新a.data,也就是a所包裹的张量。在PyTorch中,如果某个函数后面加上了“_”,就表明要用这个函数的计算结果更新当前的变量。例如,a.data.add_(3)的作用是将a.data的数值更新为a.data加上3。
任务4训练模型最后,将原始的数据散点联合拟合的直线画出来,如下所示:图2.20数据点与拟合线
任务5预测数据在测试数据集上应用我们拟合的直线来预测对应的y,也就是编程水平成绩。只需要将测试数据的x值带入我们拟合的直线即可:
任务5预测数据那么,预测结果到底准不准呢?我们不妨把预测数值和实际数值绘制在一起,如下所示:图2.21拟合线与预测数据
本章小节2.1PyTorch介绍2.1.1PyTorch概述2.1.2计算图概述2.2环境搭建.2.2.1Anaconda安装2.2.2PyTorch安装2.2.2Pycharm安装2.3PyTorch基本使用2.3.1张量2.3.2数学运算2.3.3数理统计2.4实践任务任务1认识线性回归任务2准备数据任务3设计模型任务4训练模型任务5预测数据
您可能关注的文档
- 深度学习案例教程 课件2.1、2.2 .pptx
- 深度学习案例教程 课件2.3张量与数学运算(共5节).pptx
- 深度学习案例教程 课件3.1手写数字识别任务介绍.pptx
- 深度学习案例教程 课件3.2神经网络搭建.pptx
- 深度学习案例教程 课件3.3激活函数的含义.pptx
- 深度学习案例教程 课件3.4.1MNIST数据集处理.pptx
- 深度学习案例教程 课件3.4.2全连接神经网络搭建.pptx
- 深度学习案例教程 课件3.4.3 手写数字识别网络训练.pptx
- 深度学习案例教程 课件3.4.4手写数字识别测试和评估.pptx
- 深度学习案例教程 课件3.5 感知机的原理(扩展知识阅读).pptx
- 国有企业党支部书记2024年组织生活会个人“四个带头”对照检查材料范文.docx
- 2024年党员干部民主生活会、组织生活会对照检查材料(四个带头)参考范文2篇.docx
- 2024年度组织生活会和民主评议党员大会实施方案参考范文(含:5个附件表格).docx
- 国有企业党支部书记组织生活会个人对照检查材料(四个带头)供参考.docx
- 浙教版9年级上册数学全册教学课件(2021年11月修订).pptx
- 苏教版8年级上册数学全册教学课件(2021年10月修订).pptx
- 比师大版数学4年级下册全册教学课件.pptx
- 冀教版5年级上册数学全册教学课件.pptx
- 办公室普通党员2024年组织生活会个人对照检查发言材料供参考.docx
- 领导班子成员2025年组织生活会“四个带头”对照检查材料范文.docx
文档评论(0)