- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据库增值,突破传统市场调研的局限基于数据挖掘技术于多个数据库间的连接映射与整合的应用.
数据库增值,突破传统市场调研的局限
——基于数据挖掘技术于多个数据库间的连接、映射与整合的应用
??摘要:多个数据库间的连接、映射与整合,是数据仓库管理中会使用到的数据库增值方法,此方法的优点是不需要额外支出数据收集成本,而是利用数据挖掘的方法增加数据信息,使数据库的价值得到提升。本文将讨论,如何将此方法应用于商用PC用户市场调研项目中,从而帮助PC厂商精确锁定市场,实现精确销售,同时节省了成本,突破了传统市场调研方法的局限。????????Abstract????????To increase the value of databases, we can link, map and integrate these databases; meanwhile we can save the budget for data collection. The method can also be used in market research. This paper discusses how to apply this method into market research, by introducing a case whose purpose is to estimate commercial PC business users’ market size and obtain the potential customers’ contact list and PC inventory information to increase the effect of Customer Relationship Management. ????????关键词:数据库连接? 数据库增值? 回归分析? 数据挖掘? Two-Step聚类????????一、研究思路????????(一)“多个数据库间的连接和整合”思路介绍????????数据库连接:数据库连接是指在多个数据库之间利用相同的字段建立关系。????????数据库映射:在数据查询和存储的过程中,利用数据库连接将多个数据库中的记录相对应,这个过程即为映射。????????数据库整合:在数据库连接、映射的基础上,我们可以建立多个数据库间字段的推导模型,并实施模型,实现数据库整合。例如,数据库(A)包含字段X1~Xm和Z,数据库(B)包含字段Y1~Ym和Z,2个数据库拥有相同的字段“Z”,利用字段Z可以将2个数据库建立连接,同时数据库(B)中的Z字段是数据库(A)中Z字段的一部分,将2个数据库进行映射,并建立Y1~Ym与X1~Xm之间的推导模型,将缺失的部分Y1~Ym字段补齐,我们便可以得到一个整合后的完整数据库。????????????????我们将这个思路与方法运用到市场调研当中,结合电话抽样调查的一手数据,将其与现有数据库整合,在成本投入最少的情况下,实现现有数据库增值的目的。????????(二)数据推导方法探讨????????对于不同类型的字段,我们应使用不同的方法,下表分别列举了推导不同类型字段的方法:????????????????(三)此方法在PC商用市场中的应用????????目前国内各大PC厂商越来越关注商用PC市场的消费潜力,但如何在众多的城市和行业中快速有效的找到商业机会,并且锁定最具投资价值的目标企业进行精确销售?????????在研究商用PC市场的规模和潜力时,最重要的一个指标是企业PC保有量,这是由于PC属于易耗品,并且日渐庞大的企业数据库也对PC性能提出越来越高的性能要求,这就使得企业的PC需要定期更新,所以在相同更新率的情况下, PC保有量越高的企业意味着它的PC消费能力也越高。如何帮助PC厂商快速找到那些PC保有量高的企业,进行用户拓展,这是传统市场调研方法无法做到的,因为传统的市场调研方法通过抽样调查推总,只能提供商用PC市场的总体保有量有多少,却无法告诉PC厂商各个企业的PC保有量的具体数值。????????按照传统的市场调研方法,若要得到所有企业的PC保有量,除非进行普查,否则别无他法,但是普查的成本不是某一个PC厂商所能承受的。????????那是否还有其他既节省成本,又能够精确了解各企业PC保有量的方法呢?????????这种情况下,我们可以利用本文中提到的“多个数据库间的连接、映射与整合”的方法来实现。具体的研究思路如下:????????第一步,对应图1,确定现有数据库资源:????????数据库(A):中国大陆地区500万家企业的数据库,数据库中字段包括:企业名称,企业员工人数,企业销售收入,企业经济类型等。????????数据库(B):通过市场调研,得到企业PC保有量的数据库,字段包括:企业名
文档评论(0)