- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
4.2线性回归模型用于房价预测
在平时生活中,我们经常会遇到需要根据某些已知变量来预测某个变量的情况。例如,网站会根据已有的历史数据(如新用户的注册量、老用户的活跃度、网站内容的更新频率等)预测用户的支付转化率。项目导入
通过资料了解到,利用线性回归模型即可实现上述功能。于是开始训练线性回归模型用于房价预测。项目导入
采用的数据集是著名的波士顿房价数据集,其网址为/datasets/boston。数据集共记录了506条波士顿郊区的房价(房价的平均值)以及13个影响因素信息。项目导入
影响波士顿郊区房价的因素主要有城镇人均犯罪率住宅用地所占比例城镇中非零售业的商业用地所占比例每栋住宅的房间数距离5个波士顿就业中心的加权距离地区中有多少房东属于低收入人群距离高速公路的便利指数项目导入
数据集的前22行是信息介绍,从第23行开始是数据,经过处理后的部分数据如表2-1所示。12345678910111213140.0063218.002.31000.53806.575065.204015.30396.904.9824.000.027310.007.07000.46906.421078.904017.80396.909.1421.600.027290.007.07000.46907.185061.104017.80392.834.0334.700.032370.002.18000.45806.998045.806018.70394.632.9433.40……0.069050.002.18000.45807.147054.206018.70396.905.3336.200.029850.002.18000.45806.430058.706018.70394.125.2128.700.0882912.507.87000.52406.012066.605015.20395.6012.4322.900.1445512.507.87000.52406.172096.105015.20396.9019.1527.10表2-1波士顿房价数据集(部分)项目导入
本项目基于波士顿郊区房价数据集,分别使用线性回归、岭回归和套索回归构建模型,完成波士顿房价预测,并显示各种算法的回归结果。项目导入
项目分析按照项目要求,训练线性回归预测模型的步骤分解如下:第1步:数据准备。首先应用Pandas读取波士顿房价数据,然后将数据集拆分为特征变量与标签两部分。第2步:训练与评估模型。将波士顿房价数据集拆分为训练集与测试集,然后使用线性回归、岭回归与套索回归算法分别训练模型,并输出评估结果。第3步:显示回归效果。绘制不同alpha取值下,3个模型的回归效果图。
项目实施——波士顿房价线性回归预测1.数据准备步骤1导入Pandas与NumPy库。步骤2读取波士顿房价数据集,并将数据集拆分为特征变量与标签两部分。9波士顿房价线性回归预测点击此处播放微课
指点迷津如果从网址/datasets/boston不能正确导入波士顿房价数据集,也可以使用本书提供的配套素材“item2/item2-ss-data.txt”,如果使用本书提供的配套素材,须将该文件复制到当前工作目录中。10项目实施——波士顿房价线性回归预测
步骤3将特征变量(data)与标签(target)分别存储于数组x和y中。11【参考代码】importpandasaspdimportnumpyasnp#读取数据并将数据集进行分离,拆分为特征变量(data)与标签(target)data_url=/datasets/bostonraw_df=pd.read_csv(data_url,sep=\s+,skiprows=22,header=None)data=np.hstack([raw_df.values[::2,:],raw_df.values[1::2,:2]])target=raw_df.values[1::2,2]#将特征变量(data)与标签(target)分别赋值给x和yx,y=data,target项目实施——波士顿房价线性回归预测1.数据准备
指点迷津12(1)pd.read_csv(data_url,sep=\s+,skiprows=22,header=None)函数用于读取csv文件,第一个参数为必填参数,表示读取的文件路径;“sep”参数可定义列与列之间的分隔符,默认为逗号,指定为“\s+”的含义是分隔符为一个或多个(数量不限)空格;“skiprows=22”表示忽略前面的
您可能关注的文档
- 17至18世纪欧洲美术中外美术简史之十二36课件讲解.pptx
- 18词类下30课件讲解.pptx
- 19世纪欧洲美术中外美术简史之十三30课件讲解.pptx
- 20世纪欧洲美术中外美术简史之十四79课件讲解.pptx
- 21安装Maya2018Maya3Dpropmodeling22课件讲解.pptx
- 21仓库选址的影响因素58课件讲解.pptx
- 21车辆机械02课件讲解.pptx
- 21导学动漫动漫34课件讲解.pptx
- 21导学学习指导知识与技能梳理动漫动漫28课件讲解.pptx
- 21幼儿健康教育的目标安康51课件讲解.pptx
- 2025四川凉山州中共会东县委组织部 中共会东县委社会工作部 会东县人力资源和社会保障局 定向招聘社.docx
- 2025呼伦贝尔扎兰屯市招聘16名社区工作者备考题库完整答案详解.docx
- 2025天津银行资产负债管理部总经理或副总经理招聘1人备考题库含答案详解(达标题).docx
- 2025四季度浙商银行金华分行社会招聘备考题库带答案详解(完整版).docx
- 2025四川银行分支机构对公专项社会招聘备考题库及一套完整答案详解.docx
- 2025天津银行高级研究人才招聘备考题库参考答案详解.docx
- 2025嘉兴银行驻点分支行授信审批岗招聘备考题库含答案详解(精练).docx
- 2025吉林白山市招聘工会社会工作者20人备考题库含答案详解(培优).docx
- 2025四季度浙商银行嘉兴分行社会招聘备考题库含答案详解(实用).docx
- 2025宁波慈溪胜山镇人民政府公开招聘编外工作人员2人备考题库及答案详解(夺冠系列).docx
原创力文档


文档评论(0)