- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1 学习任务二 使用Apriori算法实现 菜品的关联分析 目录 学习任务一 使用协同过滤算法实现 菜品的智能推荐 2 学习任务三 使用K-Means算法进行 客户价值分析 3 学习任务四 用决策树算法实现餐饮 客户流失预测 4 小结 5 客户流失是指客户与企业不再有交易互动关系。在激烈的市场竞争环境中,客户拥有更多的选择空间和消费渠道。如何提高客户的忠诚度是现代企业营销人员在一直讨论的问题。大规模客户的异常变动,往往意味着一个市场的变更和调整,一不小心甚至会对局部(区域)市场带来致命的打击。 在任何一个行业,客户毕竟是有限的,特别是优质的客户,更是弥足珍贵的,20%的优质客户能够带给一个企业80%的销售业绩。优质的客户自然会成为各个厂家争夺的对象。 了解客户流失 在本案例中,客户流失因素主要有以下4个。 菜品因素。菜品味道不好,菜品单一或不齐全,菜品不新鲜等。 服务因素。服务环境脏,服务秩序乱,服务态度差,服务效率低,服务能力弱,收费不合理等。 客户自身因素。客户往往对菜品或服务期望太高,而实际的消费体验比较差,导致心里不平衡,产生了不满情绪;客户消费的多样化,多层次化,复杂多变性和非理性化,因此,客户在消费时,并不承诺放弃尝试其他餐厅的就餐体验;客户工作和生活地点变更,采取就近原则。 竞争者因素。其他餐饮企业通过优惠活动或广告宣传等建立了某种竞争优势,吸引更多客户。 了解客户流失 决策树在分类、预测、规则提取等领域有着广泛应用。在20世纪70年代后期和80年代初期,机器学习研究者J.Ross Quinilan提出了ID3算法以后,决策树在机器学习、数据分析领域得到极大的发展。Quinilan后来又提出了C4.5,成为新的监督学习算法。1984年几位统计学家提出了CART分类算法。ID3和CART算法大约同时被提出,都是采用类似的方法从训练样本中学习决策树。 决策树是一树状结构,它的每一个叶节点对应着一个分类,非叶节点对应着在某个特征上的划分,根据样本在该特征上的不同取值将其划分成若干个子集。对于非纯的叶节点,多数类的标号给出到达这个节点的样本所属的类。构造决策树的核心问题是在每一步如何选择适当的特征对样本做拆分。对一个分类问题,从已知类标记的训练样本中学习并构造出决策树是一个自上而下、分而治之的过程。 了解决策树算法 1. 决策树概述 常用的决策树算法如表所示。 了解决策树算法 1. 决策树概述 决策树算法 算法描述 ID3 其核心是在决策树的各级节点上,使用信息增益方法作为属性的选择标准,来帮助确定生成每个节点时所应采用的合适属性。 C4.5算法 C4.5决策树生成算法相对于ID3算法的重要改进是使用信息增益率来选择节点特征。C4.5算法既能够处理离散型特征,也可以处理连续型特征。 CART算法 CART决策树是一种十分有效的非参数分类和回归方法,通过构建树、修剪树、评估树来构建一个二叉树。当终结点是连续型特征时,该树为回归树;当终结点是分类特征时,该树为分类树。 C5.0算法 C5.0是C4.5算法的修订版,适用于处理大数据集,采用Boosting方式提高模型准确率,根据能够带来的最大信息增益的字段拆分样本。 本案例使用CART算法预测餐饮客户流失。 决策树的应用十分广泛,目前决策树成功运用于医学、制造业、天文学和分支生物学等诸多领域。相对于其他数据挖掘算法,决策树在以下几个方面比较有优势。 易于理解和实现。人们在通过解释后都有能力去理解决策树所表达的意义。 数据的准备往往是简单或者是不必要的。 能够同时处理数据型和常规型特征。 易于通过静态测试来对模型进行评测。 在相对短的时间内能够对大型数据源做出可行且效果良好的结果。 了解决策树算法 2. 决策树优缺点 决策树自身也存在一些缺陷和不足,主要包括以下几个方面的问题。 对有时间顺序的数据,需要很多预处理的工作。 当类别太多时,错误可能会增加得比较快。 在处理特征关联性比较强的数据时,分类效果不是很好。 了解决策树算法 2. 决策树优缺点 CART分类算法可以使用rpart包中的rpart函数来实现,其基本使用语法如下。 rpart(formula, data, method, parms, control, ...) rpart函数的常用参数及其说明,如表所示。 了解决策树算法 3. rpart函数及其参数介绍 参数 说明 formula 接收公式。表示回归方程的表达式。无默认。 data 接收data frame。表示进行训练的数据。无默认。 Method 接收分割方法的变量。表示根据因变量的数据类型选择相应变量的分割方法,当因变量为连续型时取anova,当因变量为离散型时取class,当因变量为计数型时取poisson,当因变量为;
您可能关注的文档
- 主推进动力装置 任务4.3:柴油机增压系统和设备的操作与管理 任务4.3 柴油机增压系统与设备的操作与管理.ppt
- 助理理财规划师考证培训 第一节 保险基础知识 个人家庭面临的主要风险.pptx
- 助力护考---护士执业资格考试辅导 颅内压增高与脑疝患者的护理 2.6.2颅内压增高脑疝患者的护理(1)(1).pptx
- 助力护考---护士执业资格考试辅导 尿石症患者的护理 2.4.6尿石症患者的护理.pptx
- 专家名录 北京大学国际医院 北京大学国际医院 周谋望.pptx
- 专家名录 徐州医科大学附属医院 徐州医科大学附属医院周夫瑞.pptx
- 专题地图编制 地图投影选择和设计 地图投影选择和设计.pptx
- 专题地图编制 专题地图编制的原则与方法 专题地图的制图综合完整.pptx
- 专题地图编制 专题地图资料的处理 专题地图资料处理.pptx
- 专业技能训练子库 有源RFID的系统应用 3.3有源RFID的系统应用.pptx
文档评论(0)