- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Python使⽤⽹格搜索与交叉验证的决策树算法实现波⼠顿房价预测(附波⼠顿
房价数据集)
第⼀步:导⼊数据
#载⼊此项⽬所需要的库
import numpy as np
import pandas as pd
import visuals as vs # Supplementary code
#检查你的Python版本
#from sys import version_info
#if version_info.major !=3 and version_info.minor != 7:
#raise Exception(请使⽤Python 3.7来完成此项⽬)
%matplotlib inline
#载⼊波⼠顿房屋的数据集
data = pd.read_csv(housing.csv)
prices = data[MEDV]
features = data.drop(MEDV, axis = 1)
print(Boston housing dataset has {} datapoints with {} variables each. .format(*data.shape))
第⼆步:分析数据
# ⽬标:计算价值的最⼩值
minimum_price = prices.min()
print (minimum_price)
# ⽬标:计算价值的最⼤值
maximum_price =prices.max()
# ⽬标:计算价值的平均值
mean_price = prices.mean()
# ⽬标:计算价值的中值
median_price = prices.median()
# ⽬标:计算价值的标准差
std_price = prices.std()
# ⽬标:输出计算的结果
print (Statistics for Boston housing dataset:\n)
print (Minimum price: ${:,.2f}.format(minimum_price))
print (Maximum price: ${:,.2f}.format(maximum_price))
print (Mean price: ${:,.2f}.format(mean_price))
print (Median price ${:,.2f}.format(median_price))
print (Standard deviation of prices: ${:,.2f}.format(std_price))
第三步:模型衡量标准
def performance_metric(y_true, y_predict):
计算并返回预测值相⽐于预测值的分数
from sklearn.metrics import r2_score
score = r2_score(y_true,y_predict)
return score
def performance_metric2(y_true, y_predict):
计算并返回预测值相⽐于预测值的分数
import numpy as np
import math
y_true_mean = np.mean(y_true)
y_predict_mean = np.mean(y_predict)
SSR = 0
varX = 0
varY = 0
for i in range(0, len(y_true)): #多少实例
diffxxBar = y_true[i] - y_true_mean
diffyyBar = y_predict[i] - y_predict_mean
SSR += (diffxxBar * diffyyBar)
varX += diffxxBar ** 2 # 求平⽅然后累计起来
varY += diffyyBar ** 2 # 求平⽅然后累计起来
SST = math.sqrt(varX * varY)
score = SSR/SST
return score
第四步:分析模型的表现(偏差⽅差)
#根据不同的训练集⼤⼩,和最⼤深度,⽣成学习曲线
vs.ModelLearning(X_train, y_train)
# 根据不同的最⼤深度参数,⽣成复杂度曲线
vs.ModelComp
您可能关注的文档
最近下载
- 低压电工实操考试要点(最新).docx
- 新人教版三年级上册道德与法治全册知识点(新教材).pdf
- 大学生职业生涯规划ppt...ppt VIP
- 脑的发育与可塑性.ppt VIP
- 2025年中考第二次模拟考试卷:语文01(浙江卷)(解析版).docx VIP
- 中文核心期刊要目总览(2023年版).docx
- 2025室内设计规范.docx VIP
- JTGT L80-2014 高速公路改扩建交通工程及沿线设施设计细则.pdf VIP
- 安徽芜湖市湾沚区国有资本建设投资有限公司及其子公司招聘笔试题库及参考答案详解1套.docx VIP
- 新版ISOIEC 270022022标准发布及关键变化点解读.doc VIP
原创力文档


文档评论(0)