- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
构建电商平台运输行为预测电商平台用户购买预测——逻辑回归
任务描述电商平台运输预测是一项非常重要的任务。坚持一切为了人民,通过预测用户的运输行为,电商平台可以更好地了解用户需求。然而,运输行为往往是一个难以捉摸的过程,不受规律和时间限制的影响,这给预测模型的建立带来了很大的挑战。本任务基于逻辑回归模型,从历史交互数据中学习运输行为的一般特征,预测下一个月用户可能会运输哪些品牌。将重点关注电商平台用户的运输行为,提高运输预测的准确率,优化平台的运营管理和商业决策,从而提高平台的竞争力和收益。
任务要求利用sklearn库建立逻辑回归模型。
逻辑回归模型
逻辑回归模型二分类问题是一种基本的分类问题,它涉及将数据样本分为两个不同的类别或标签中的一个。例如,将垃圾邮件与正常邮件分类、将肿瘤分为恶性和良性等都是二分类问题。在二分类问题中,通常将一个类别标记为“正例”(positive)和另一个标记为“反例”(negative)。分类模型的目标是学习如何将输入特征与相应的标签相关联,以便在新的未知数据上进行分类预测。
逻辑回归模型常用的二分类算法包括逻辑回归、决策树、随机森林等。这些算法在不同的数据集和应用场景中表现不同,因此,选择合适的算法以及进行适当的特征工程是进行二分类任务的重要部分。
逻辑回归模型在任务3.1的学习中已经介绍了线性回归的一般形式,给出了自变量x与因变量y成线性关系时所建立的函数关系。但是,现实场景中更多的情况y不是与x成线性关系,而是与x的某个函数成线性关系,此时需要引入广义线性回归模型。需要注意的是,逻辑回归虽然称作“回归”,但实际上是一种分类算法。该算法期望所有预测值都介于0~1之间。具体的分类方法为设定一个分类阈值,将预测结果y大于分类阈值的样本归为正类,反之归为反类。
逻辑回归模型逻辑回归虽然称作“回归”,但实际上是一种分类算法。该算法期望所有预测值都介于0~1之间。具体的分类方法为设定一个分类阈值,将预测结果y大于分类阈值的样本归为正类,反之归为反类。决策边界
逻辑回归模型假设函数如下式所示。 表示分类阈值参数集。 上式的图像如图所示,保证了所有函数值都介于[0,1]之间。Logstic函数如下式所示。
逻辑回归模型合并左边两式转为标准逻辑回归形式如左式所示。
逻辑回归模型建模步骤根据分析目的设置因变量和自变量,并进行属性筛选列出线性回归方程,估计回归系数模型检验模型预测
逻辑回归模型LogisticRegression类使用scikit-learn库中linear_model模块的LogisticRegression类可以建立逻辑回归模型,其语法格式如下。classsklearn.linear_model.LogisticRegression(penalty=l2,dual=False,tol=0.0001,C=1.0,fit_intercept=True,intercept_scaling=1,class_weight=None,random_state=None,solver=liblinear,max_iter=100,multi_class=ovr,verbose=0,warm_start=False,n_jobs=1)
逻辑回归模型LogisticRegression类常用参数及其说明penalty接收str。表示正则化选择参数,可选l1或l2。默认为l2solver接收str。表示优化算法选择参数,可选参数为newton-cg、lbfg、liblinear、sag,当penalty=l2时,4种都可选;当penalty=l1时,只能选liblinear。默认为liblinearmulti_class接收str。表示分类方式选择参数,可选ovr和multinomial。默认为ovr参数名称说明classsklearn.linear_model.LogisticRegression(penalty=l2,dual=False,tol=0.0001,C=1.0,fit_intercept=True,intercept_scaling=1,class_weight=None,random_state=None,solver=liblinear,max_iter=100,multi_class=ovr,verbose=0,warm_start=False,n_jobs=1)
逻辑回归模型LogisticRegression类常用参数及其说明class_weight接收balanced以及字典。表示类型权重参数,如对于因变量取值为
您可能关注的文档
- 《数据挖掘与机器学习》 课件 1.1.1 初识机器学习与数据挖掘、Python、Anaconda.pptx
- 《数据挖掘与机器学习》 课件1.1.2 安装Python.pptx
- 《数据挖掘与机器学习》 课件1.2 安装PyCharm.pptx
- 《数据挖掘与机器学习》 课件2.1 分析农产品类型情况.pptx
- 《数据挖掘与机器学习》 课件2.2.1 数据读取与写入.pptx
- 《数据挖掘与机器学习》 课件2.2.2 pandas数据结构.pptx
- 《数据挖掘与机器学习》 课件2.2.3 数据清洗.pptx
- 《数据挖掘与机器学习》 课件2.2.4 数据合并.pptx
- 《数据挖掘与机器学习》 课件2.2.5 分组聚合、处理农产品基本信息数据.pptx
- 《数据挖掘与机器学习》 课件2.3.1 基本语法和常用参数.pptx
- 某县纪委监委开展“校园餐”突出问题专项整治工作汇报22.docx
- 中小学校园食品安全与膳食经费管理专项整治工作自查报告66.docx
- 某县委常委、宣传部部长年度民主生活会“四个带头”个人对照检查发言材料.docx
- XX县委领导班子年度述职述廉报告3.docx
- 某县纪委关于校园餐问题整治工作落实情况的报告.docx
- 中小学校园食品安全与膳食经费管理专项整治工作自查报告22.docx
- 某县税务局党委领导班子年度民主生活会“四个带头”对照检查材料.docx
- 某县委书记在县委常委班子年度民主生活会专题学习会上的讲话.docx
- 某县纪委校园餐问题整治工作落实情况的报告.docx
- 某区委副书记、区长年度民主生活会对照检查材料.docx
文档评论(0)