数据分析逻辑回归逻辑回归模型实现糖尿病分析预测下42课件讲解.pptxVIP

  • 0
  • 0
  • 约1.57千字
  • 约 11页
  • 2026-02-03 发布于陕西
  • 举报

数据分析逻辑回归逻辑回归模型实现糖尿病分析预测下42课件讲解.pptx

数据分析-逻辑回归-逻辑回归模型实现糖尿病分析预测(下)

任务描述任务描述:通过逻辑回归模型对于糖尿病问题进行分析与预测。主要内容:1.逻辑回归算法的简介2.逻辑回归算法的工作原理3.逻辑回归算法的参数估计4.逻辑回归算法的决策边界

逻辑回归模型实现糖尿病分析预测关键步骤讲解数据获取数据预处理划分训练集和测试集训练逻辑回归模型预测和评估特征缩放

数据获取1、可以从UCI机器学习存储库中获取PimaIndiansDiabetes数据集。对于此示例,将直接使用已经整理好的CSV文件。importpandasaspdurl=/jbrownlee/Datasets/master/pima-indians-diabetes.data.csvnames=[Pregnancies,Glucose,BloodPressure,SkinThickness,Insulin,BMI,DiabetesPedigreeFunction,Age,Outcome]data=pd.read_csv(url,names=names)

数据预处理2、首先,需要检查和处理缺失值。在该数据集中,有些变量有缺失值,标记为0。稍后会将这些0替换为np.nan并使用平均值填充。对于现在,先分离特征X和标签y。importnumpyasnpX=data.iloc[:,:-1].valuesy=data.iloc[:,-1].values#将0值??替换为NaN,以便可以用列的平均值填充X[np.where(X==0)]=np.nan

划分训练集和测试集3、需要将数据集分为训练集和测试集,以便可以使用训练集来训练模型,然后使用测试集来评估模型的性能。fromsklearn.model_selectionimporttrain_test_splitX_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=42)

特征缩放4、在训练逻辑回归之前,需要对数据进行特征缩放,以确保所有特征在统一的量级上。fromsklearn.preprocessingimportStandardScalerscaler=StandardScaler()X_train=scaler.fit_transform(X_train)X_test=scaler.transform(X_test)

训练逻辑回归模型5、现在,准备好训练逻辑回归模型了。fromsklearn.linear_modelimportLogisticRegressionclassifier=LogisticRegression(random_state=42)classifier.fit(X_train,y_train)

预测和评估6、现在可以在测试集上进行预测并评估模型性能。y_pred=classifier.predict(X_test)fromsklearn.metricsimportaccuracy_score,confusion_matrixacc=accuracy_score(y_test,y_pred)print(Accuracy:,acc)cm=confusion_matrix(y_test,y_pred)print(ConfusionMatrix:\n,cm)

任务小结逻辑回归模型实现糖尿病分析预测数据获取数据预处理训练逻辑回归模型特征缩放预测和评估划分训练集和测试集

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档