数据分类在零售业产品营销中应用研究.docVIP

下载本文档

4
0
约2.8千字
约 7页
2018-11-03 发布于福建
举报
版权申诉

数据分类在零售业产品营销中应用研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据分类在零售业产品营销中应用研究

数据分类在零售业产品营销中应用研究　　【摘要】对零售业的目标人群进行了有效分类。提出了使用ID3算法对数据样本进行分类，建立数据描述属性与类别属性之间的决策树模型。使用此模型对客户与是否会购买产品进行分析，缩小目标客户范围，指导营销人员缩小营销范围，提高营销效果，提高产品销售量。通过实例验证了此方法具有一定的可信度。　　【关键词】零售业；ID3算法；决策树；营销　　1.引言　　企业要生存和发展，就必需了解市场，了解客户，树立“以市场为导向，以客户为中心”的经营理念。[1]随着信息时代的到来，人们收集、存储和访问数据的能力大大增强，快速增长的海量数据不断充斥着我们的生活。为了从海量数据中发现有价值的信息，从而制定正确的决策，数据挖掘技术应运而生，并逐渐显示出强大的生命力。文章使用数据分类方法对海量数据进行分析和挖掘，力求从中找到目标客户，提高客户营销效果，创造更高的客户价值，最后结合实例使用ID3算法分析并检验了方法的有效性。　　2.数据分类过程　　数据分类一般经历以下几个步骤：数据准备、数据开采、分类结果的表达和解释。　　2.1 数据准备　　数据准备主要包括数据的选择、预处理和数据的转换。数据的选择主要是搜索所有与研究对象相关的内部数据和外部数据，并从中选择适用于下一步进行数据分类的数据。同时，为了进一步提高数据质量，为数据分析做准备，还需要对数据进行预处理，即将数据转换成能进行数据挖掘的类型，并进行必要的数据约减。最后，还需要对数据进行转换，即将数据转换成最终的针对挖掘算法建立的分析模型，建立一个真正适合挖掘算法的分析模型。　　2.2 数据开采　　数据开采需要选择数据挖掘算法。本文使用决策树算法的ID3算法对数据进行分类。决策树算法是在给定已知数据类别属性的情况下采用自顶向下的递归方式产生一个树形结构，树的最顶端称为根结点，最底层结点称为叶子节点，每个叶子结点代表样本数据的类别或类分布。　　ID3算法是决策树算法中较为常用的一种算法，主要用来处理离散型描述属性的数据。在分类的过程中，ID3算法采??信息增益作为分类的依据。即每次迭代都从给定的描述属性集中选择一个信息增益值最大的描述属性作为根结点的分支属性。　　2.3 结果的表达和表示　　该过程是根据分类的目标对分类结果进行分析，把有价值的信息提取出来并通过一定的数据展示工具将挖掘结果以直观的方式展示给决策者。　　3.零售业与数据分类　　零售业有着产品多样化、客户涉及范围广、客户需求多样化等特点，如何在众多人群中确定目标营销人群，找到潜在客户，制定有针对性的营销策略，使得客户和销售者的利润都达到最大化，进而达到“双赢”的目标成为众多零售业在产品销售过程中亟待解决的问题。　　文章以某自行车零售商的市场调查数据为分析依据，利用数据分类的ID3算法对客户的描述属性按照不同的类别属性进行分类，从而发现哪些类型的人群更加趋向于购买产品，哪些类型的人群可能对产品不感兴趣，进而为制定营销策略提供理论依据。　　4.数据分类在零售业中的应用　　4.1 数据准备　　本文中，我们采用某自行车零售业市场调查的数据作为分类的数据集。此数据集的记录行数一共有18000行，数据集的描述属性有Age、CommuteDistance、CustomerKey、Gender、Childreninhome、YealyIncome等，类别属性包括两种取值：0：代表不会购买自行车；1：代表会考虑购买自行车。图3.1显示了部分数据样本。　　4.2 数据模型的建立　　设置决策挖掘模型的相关参数，参数设置界面如图3.2所示。　　COMPLEXIY_PENALTY：决策树的成长参数。此值减小会使决策树的分支和层次数目增大，此值增大会导致相反的结果。　　FORCE_REGRESSOR：该参数强制数据集用作回归公式的输入变量，仅限于使用回归树。　　MIXIMUM_INPUT_ATTRIBUTES：算法可以处理输入属性的最大数量。　　MIXIMUM_OUTPUT_ATTRIBUTES：算法可以处理分类属性的最大数量。　　MINIMUM_SUPPORT：指定叶节点中必须包含的最小样本数量。此值小于1表示最小样本数量为总数量的百分比，此值大于1表示最小样本数量为指定的绝对数量。　　SORCE_METHOD：指定选择分支属性的度量标准。在本实例中我们将这个值取值为1，表示使用信息增益作为度量标准。　　SPLIT_METHODE：指定分支模式。可用模式有二元分支、完整分支或根据算法判断。　　4.3 决策树生成　　根据设定的参数，使用SQL Server 2005中的决策树方法最终可以得到如图3.3所示的决策树模型。