- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
线性模型;教学内容;矩阵微积分;关于概率的一些基本概念;概率的一些基本概念;概率的一些基本概念;概率的一些基本概念;线性回归模型;模型:
增广权重向量和增广特征向量
;第1步,我们需要导入所需的包。
增广权重向量和增广特征向量
1.from?sklearn?import?datasets???#导入sklearn?中的数据集??
2.from?sklearn.model_selection?import?train_test_split?#导入数据集划分模块??
3.from?sklearn.linear_model?import?LinearRegression?#导入线性回归模型??
4.from?sklearn.metrics?import?mean_squared_error?#导入均方差评价指标?
?
;第2步,首先加载数据集
增广权重向量和增广特征向量
1.#加载波士顿房价数据集??
2.boston_data=datasets.load_boston()??
3.#获取波士顿房价数据集的特征集??
4.bonston_x=boston_data.data???
5.#获取波士顿房价数据集的目标值??
6.bonston_y=boston_data.target??
7.#查看数据集键值对??
8.print(boston_data.keys())??
9.#查看数据集描述??
10.print(boston_data.DESCR)??
11.#查看数据集特征值形状,可以看出有506个样本,每个样本有13个特征??
12.print(bonston_x.shape)????
13.#查看数据集目标值形状,有506个目标值。可以发现没有缺失值??
14.print(bonston_y.shape)??
?
;通过结果可以知道共有506个样本,特征向量维度为13,也就是说房价有13个影响因素。增广权重向量和增广特征向量
?
;第3步,划分训练集和测试集,其中测试集占数据集的20%。
1.#对数据集进行划分,其中测试集占数据集的20%??
2.features_train,features_test,target_train,target_test?=train_test_split(bonston_x,bonston_y,test_size=0.2)
?
;第4步,实例化模型并进行训练。
1.#实例化模型??
2.model?=LinearRegression()??
3.#进行模型训练??
4.model.fit(features_train,target_train)?
?
;第5步,对测试集进行预测,并输出预测目标值和真实目标值,从而直观地感受预测目标值与真实值目标的差距。
1.#进行预测??
2.target_test_predict=model.predict(features_test)??
3.#查看预测目标值
4.print(target_test_predict)??
5.#查看真实目标值??
6.print(target_test)??
?
;第6步,对模型进行评价,采用的是均方??评价函数:
1.#?对模型效果进行评价??
2.error=mean_squared_error(target_test,target_test_predict)??
3.print(测试数据的误差:,error)??
?
;逻辑回归模型;
?
;
?
;导入需要使用的包。
1.#导入需要使用的包??
2.#导入划分训练集、测试集需要使用的包??
3.from?sklearn.model_selection?import?train_test_split??
4.#导入鸢尾花数据集??
5.from?sklearn.datasets?import?load_iris??
6.#导入sklearn中的逻辑回归模型??
7.from?sklearn.linear_model?import?LogisticRegression??
?
;然后加载鸢尾花数据集,查看数据集键值对,查看数据集描述,查看特征集形状。
1.#加载鸢尾花数据集??
2.iris_data=load_iris()??
3.#查看鸢尾花数据集的键值对??
4.print(iris_data.keys())??
5.#查看鸢尾花数据集的描述??
6.print(iris_data.DESCR)??
7.#查看鸢尾花特征集的形状??
8.print(iris_data.data.shape)?
??
?
;接下来划分数据集。
1.#将数据集划分为测试集和训练集,使用默认划分比例,测试集占数据集的25%,查看划分后训练集的形状??
2.features_trai
您可能关注的文档
- Python机器学习与项目实践- 课件 chap1-绪论.pptx
- Python机器学习与项目实践- 课件 chap2-机器学习基础概念.pptx
- Python机器学习与项目实践- 课件 chap4-前馈神经网络.pptx
- Python机器学习与项目实践- 课件 chap5-卷积神经网络.pptx
- Python机器学习与项目实践- 课件 chap6-循环神经网络.pptx
- Python机器学习与项目实践- 课件 chap7-图神经网络.pptx
- Python机器学习与项目实践- 课件 chap8-案例.pptx
- 二年级数学计算题专项练习集锦.docx
- 三年级数学(上)计算题专项练习附答案.docx
- 三年级数学(上)计算题专项练习附答案集锦.docx
文档评论(0)