数据科学发展及其在客户细分中应用.docVIP

数据科学发展及其在客户细分中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据科学发展及其在客户细分中应用

数据科学发展及其在客户细分中应用   [摘 要] 数据科学是从数据中提取知识的新兴学科,在科学研究的“第四范式”兴起的背景下被正式提出。用于商业决策和科学研究的数据产生了根本性的变化,其特征从原来主流的抽样、结构化、小规模发展到全数据、半结构和非结构化、大规模,驱动数据科学发展成为既包含传统统计方法,又包含数据挖掘、文本挖掘、过程挖掘和大数据等新兴技术的交叉学科。客户细分是典型的数据导向的商业和研究领域,数据科学在其中的应用表明,该学科所包含的各种方法,能够成功提取复杂的客户相关数据中蕴含的信息和知识,能够解决客户细分的可行性、有效性、精确性问题,为客户细分研究和商业实践提供良好的技术支撑和决策支持。   [关键词] 数据科学;客户细分;应用情况   [中图分类号] F22 [文献标识码] B   一、引言   数据产生、搜集、存储和处理方式的进化催生了数据爆炸时代,需要一门专门研究数据的各种类型、状态、属性,组织形式、变化方式和规律的科学,揭示自然界和人类行为现象和规律,为科学研究提供一种新的方法,为商业智能提供新的支撑。因此,数据科学的概念提出之后,迅速在商业和研究领域引起重视,应用越来越广泛。   客户细分(customer segmentation)是指根据客户属性划分的客户集合[1]。客户作为企业最为重要的战略性资源之一,其需求的满足关系着企业生存、壮大和永续发展,为了满足异质性的客户需求,制定相应的差异化管理策略,企业广泛应用客户细分理论作为重要管理工具,该工具甚至已成为全球使用率最高的10大管理工具之一。[2]有效的客户数据分析是客户细分成功的关键。在客户细分实践中,制约其发挥作用的因素已不再是客户数据信息量的不足,而是对客户信息资源潜在价值的挖掘不够充分。数据科学能够处理各种类型和规模的数据,充分利用数据中蕴含的信息提取出有利于商业决策和科学研究的知识,非常适用于客户细分这一依赖数据导向的领域。   二、数据科学和第四范式   “数据科学”(Data Science)起初叫“datalogy”。最初在1966年由Peter Naur提出。1996年,International Federationof Classification Societies(IFCS)国际会议召开,数据科学一词首次出现在会议(Data Science,classification, andrelatedmethods)标题里。数据科学的概念于20世纪在学术界引起广泛重视。2002年,国际科学理事会:数据委员会科学和技术(CODATA)开始出版数据科学杂志。2003年,美国哥伦比亚大学开始发布数据科学杂志,主要内容涵盖统计方法和定量研究中的应用。   概括而言,数据科学就是从数据中提取知识。[3]根据Naur(1960)[4]的观点,数据科学或称数据学是计算机科学的一个替代性称谓。1998年,C.F.JeffWu在题为“统计学等于数据科学吗?”的演讲中,建议将统计学改名为数据科学。但是这种字面上的转换,并没有将数据科学确立为一个独立的学科。Cleveland(2001)[5]首次将数据科学作为一个独立的学科提出时,将数据科学表述为统计学加上它在计算技术方面的扩展。魏瑾瑞(2014)[6]认为数据科学的理论基础是统计学,数据科学可以看作是统计学在研究范围(对象)和分析方法上不断扩展的结果。朱扬勇(2011)[7]则认为,数据科学目前只是多个相关学科“拼接”起来的一个新兴学科,尚未形成完整的学科框架体系。   从以上观点可以看出,数据科学是一门新兴的交叉学科,其真正的发展起步未久,正处在迅猛发展阶段。事实上,第四范式即数据密集型科学的提出,极大促成了数据科学的正式提出和发展。20世纪90年代中期,已故图灵奖得主格雷(Jim Gray)[9][10]提出了科学研究的“第四范式(the fourth paradigm)”――数据密集型科学。不同于实验、理论、计算这三种范式,“第四范式”下,需要“将计算用于数据,而非将数据用于计算”,这种观点实际上是将数据科学从计算科学中单独区别开来了。鄂维南院士(2013)[8]也提到“大数据在科学领域的表现是数据科学的兴起,数据科学将成为科研体系中的重要组成部分,并逐渐达到与物理、化学、生命科学等自然科学分庭抗礼的地位”。   三、数据进化驱动数据科学产生和发展   如前所述,数据科学中的数据处理和分析方法是在不同学科领域中分别发展起来的,包括数学、统计和信息科技领域中的多种技术和理论,例如:信号过程、随机模型、机器学习、统计学习、计算机编程、数据工程、模式识别和学习、可视化、预测技术、不确定性模型、数据仓库和高性能计算。数据科学特别关注扩展到大数据的方法,不过普遍认为数据科学并仅限

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档