数据分析逻辑回归基于逻辑回归的学生考试分析上09课件讲解.pptxVIP

  • 0
  • 0
  • 约1.5千字
  • 约 9页
  • 2026-02-03 发布于陕西
  • 举报

数据分析逻辑回归基于逻辑回归的学生考试分析上09课件讲解.pptx

数据分析-逻辑回归-基于逻辑回归的学生考试分析(上)

任务描述任务描述:通过逻辑回归模型对学生的考试情况进行分析。主要内容:1.逻辑回归算法的多元逻辑回归2.逻辑回归算法的分类评估方法3.逻辑回归算法的ROC曲线绘制

逻辑回归算法的多元逻辑回归多元逻辑回归(MultinomialLogisticRegression)是逻辑回归算法的一种扩展,用于处理多分类问题。在多元逻辑回归中,有多个类别需要被分类。与二元逻辑回归不同,多元逻辑回归使用了多个逻辑回归模型来进行多分类。通常采用“一对多”(One-vs-Rest)或“一对一”(One-vs-One)的策略。

准确率是评估分类模型的基本指标,它表示模型正确预测的样本数占总样本数的比例。F1Score是精确率和召回率的综合评估指标,它考虑了两者的权衡。03精确率衡量模型预测为正类的样本中真正为正类的比例,召回率衡量模型正确预测为正类的样本在全部正类样本中的比例。02F1Score逻辑回归算法的分类评估方法精确率(Precision)和召回率(Recall)准确率(Accuracy)01

ROC曲线是以不同阈值下的假正类率(FPR)和真正类率(TPR)为横纵坐标绘制的曲线。混淆矩阵用来展示模型预测结果与真实结果的比对情况,它可以直观地显示模型的分类性能06对数损失是用来衡量分类模型的概率预测误差,对数损失越小表示模型概率预测越准确。05混淆矩阵(ConfusionMatrix)逻辑回归算法的分类评估方法对数损失(LogLoss)ROC曲线和AUC04

逻辑回归算法的ROC曲线绘制收集模型预测结果和真实标签对于测试集样本,使用逻辑回归模型进行预测,并记录预测得分(概率值)以及对应的真实标签。(2)设置不同的分类阈值从0到1之间设置一系列不同的分类阈值,例如0.1、0.2、0.3等。(3)根据阈值对样本进行分类将预测概率值与分类阈值进行比较,大于阈值的样本被判定为正类,小于等于阈值的样本被判定为负类。(4)计算真正类率(TruePositiveRate,TPR)和假正类率(FalsePositiveRate,FPR)在每个阈值下,根据分类结果和真实标签计算TPR和FPR。(5)绘制ROC曲线以FPR为横坐标,TPR为纵坐标,绘制一系列数据点来构建ROC曲线。每个数据点代表一个分类阈值对应的TPR和FPR。(6)计算AUC计算ROC曲线下方的面积(AUC),AUC的取值范围在0到1之间,数值越大表示分类性能越好。

逻辑回归算法的预测阈值在逻辑回归算法中,预测阈值用于将模型的概率预测转化为二元分类的判断结果。当模型输出的概率大于或等于预测阈值时,将样本分类为正类;当模型的概率小于预测阈值时,将样本分类为负类。

逻辑回归算法的过拟合与正则化逻辑回归算法的正则化有两种常见的方法:(1)L1正则化(L1Regularization)L1正则化通过在损失函数中添加参数的L1范数(绝对值之和)作为正则项。它倾向于使一些参数变为零,从而实现特征选择的效果。L1正则化可以通过控制一个超参数(正则化参数)的大小来控制正则化的强度。(2)L2正则化(L2Regularization)L2正则化通过在损失函数中添加参数的L2范数(平方和的平方根)作为正则项。与L1正则化不同,L2正则化不倾向于使参数变为零,而是减小所有参数的值。同样,L2正则化可以通过控制正则化参数的大小来控制正则化的强度。

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档