- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据的回归分析
⽬录
⼀、Excel线性回归数据分析
这⾥使⽤excel的数据分析功能来分析⽗母⾝⾼与⼦⼥⾝⾼的关系
如果没有则需要去⽂件–选项–加载项⾥⾯开启功能
⾸先点击数据分析,选择回归,然后选择对应的X和Y值,最后选择所需输出的信息即可
这⾥由于没有处理掉多余项,所以相关性会极差并出现以下图⽚,但是也不妨碍⼤概分析
⽗⼦⾝⾼关系图:
根据图中信息显⽰,⼦⼥的⾝⾼与⽗亲的⾝⾼⼤致呈正⽐关系,并由⽅程得出当⽗亲⾝⾼为75英⼨时,⼦⼥⾝⾼⼤概为69.065英⼨
母⼦⾝⾼关系图:
根据图中信息显⽰,⼦⼥的⾝⾼与⽗亲的⾝⾼⼤致呈正⽐关系
其实由与没有对数据进⾏预处理,因此得出的回归⽅程并不成⽴,但是我们还是能⼤致看出“母⾼⾼⼀窝,⽗⾼⾼⼀个”的习俗说法还是成
⽴的
⼆、判断线性回归是否成⽴
这⾥判断了4个例⼦的线性回归是否成⽴
不难看出,除了第三个外,其余例⼦中的线性回归都不成⽴
三、鸢尾花Iris数据集
1、Anaconda创建虚拟环境及安装对应的包
创建虚拟环境
1.命令⾏创建
打开命令⾏
输⼊下⾯命令
conda create-n sklearn python=3.6
tf1是⾃⼰为创建虚拟环境取的名字,后⾯python的版本可以根据⾃⼰需求进⾏选择。
2.界⾯创建
打开界⾯
创建环境
安装包
2、LinearSVC (C)⽅式实现分类
导⼊需要使⽤的包
#导⼊相应的包
import numpyas np
import matplotlib.pyplotas plt
from sklearnimport datasets
from sklearn.preprocessingimport StandardScaler
from sklearn.svmimport LinearSVC
获取数据
# 获取所需数据集
iris=datasets.load_iris()
#每⾏的数据,⼀共四列,每⼀列映射为feature_names中对应的值
X=iris.data
#每⾏数据对应的分类结果值(也就是每⾏数据的label值),取值为[0,1,2]
Y=iris.target
#通过Y=iris.target.size,可以得到⼀共150⾏数据,三个类别个50条数据,并且数据是按照0,1,2的顺序放的
对数据进⾏处理
#只取y2的类别,也就是0 1并且只取前两个特征
X=X[:,:2]
#获取0 1类别的数据
Y1=Y[Y2]
y1=len(Y1)
#获取0类别的数据
Y2=Y[Y1]
y2=len(Y2)
X=X[:y1,:2]
未经标准化的原始数据点的绘制
#绘制出类别0和类别1
plt.scatter(X[0:y2,0],X[0:y2,1],color=red)
plt.scatter(X[y2+1:y1,0],X[y2+1:y1,1],color=blue)
plt.show()
数据归⼀化处理
#标准化
standardScaler=StandardScaler()
standardScaler.fit(X)
#计算训练数据的均值和⽅差
X_standard=standardScaler.transform(X)
#⽤scaler中的均值和⽅差来转换X,使X标准化
svc=LinearSVC(C=1e9)
svc.fit(X_standard,Y1)
画出决策边界
相关函数的说明:
meshgrid() 返回了有两个向量定义的⽅形空间中的所有点的集合。x0是x值,x1是y的值
ravel() 将向量拉成⼀⾏
c_[] 将向量排列在⼀起
contourf() 等⾼线
def plot_decision_boundary(model, axis):
x0 , x1 = np .meshgrid(
您可能关注的文档
- 新目标大学英语思政微慕课.pdf
- 幼儿园一日活动各个环节.pdf
- 如何做好生物高考复习.pdf
- 新旧公路路基路面现场测试规程-常用对照.pdf
- 新发展大学英语听力教程第三册习题与讲解.pdf
- 文言文《天净沙·秋思》原文及译文.pdf
- 工厂货车司机出车工作流程.pdf
- 数据库设计范式5733.pdf
- 点燃专注企业私域流量运营.pdf
- 工程力学(高教版)教案:6.4材料在拉伸和压缩时的力学性能.pdf
- 广东省潮州市2019-2020年度高一上学期政治期中考试试卷(II)卷.doc
- 初中语文七年级下册 27 《课外古诗词诵读・竹里馆》优质课公开课课件.pdf
- 初中语文七年级下册 28 《课外古诗词诵读・春夜洛城闻笛》优质课公开课课件.pdf
- 广东省潮州市2019-2020学年高一上学期政治期中考试试卷(II)卷.doc
- 初中语文七年级下册 29 《课外古诗词诵读・逢入京使》优质课公开课课件.pdf
- 广东省潮州市2019-2020学年高一上学期政治期中试卷B卷.doc
- 广东省潮州市2019-2020学年高一下学期政治开学考试试卷A卷.doc
- 初中语文七年级下册 30 《课外古诗词诵读・晚春》优质课公开课课件.pdf
- 广东省潮州市2020版高一上学期政治期中考试试卷D卷.doc
- 广东省潮州市2020年高一上学期政治期中考试试卷A卷.doc
文档评论(0)