多源数据融合方法及其在市场调查中的应用.pdfVIP

多源数据融合方法及其在市场调查中的应用.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

STATISTICALTHEORY社会经纬

ANDPRACTICE

多源数据融合方法

及其在市场调查中的应用

王霄1王小宁²柴青慧1苏磊1付晓东1

摘要:传统在线市场调查通常利用单一数据来源,存在抽样框对调查总体涵盖不全、实施效率低下、成本

费用固化等弊端,市场研究行业越来越多地倾向于依靠多种来源数据进行混合抽样调查。迄今为止,关于

多源数据融合调研理论化、系统化的研究尚少,如何基于多源异质的大数据来源进行混合抽样调查,以及

精确推断目标总体是当前市场研究行业关注的焦点。通过重点研究综合评估效率、成本、数据质量等关键

因素下的多源数据融合技术,提出融合电信运营商、在线可访问样组、社会化媒体等多种来源数据构建多

重概率抽样框的思想,详细介绍了抽样设计及统计推断方法,通过实证阐明多源数据融合技术在抽样调

查中的基本应用和价值。最后,以市场调查最优化、智能化为导向设计“全域用户调研智能引擎”产品,实

现多源数据最优组合和执行策略的智能推荐,在确保数据质量的基础上达到降本增效目的,完成相关理

论方法向实际应用的转化。

关键词:多源数据融合;多重抽样框;参数估计;双重稳健估计

中图分类号:F713.52文献标识码:A

D0I:10.13999/ki.tjllysj.2023.12.008

一、引言短板。

市场调查设计一般要实现三个相互制约的目标:为了充分发挥概率抽样对目标总体的代表性优

数据质量、实施效率和花费成本。市场调查设计的现势和非概率样本网络调查便捷、低成本的优势,市场

实发展趋势是追求三个目标间的最优路径规划和可研究行业越来越普遍的运用混合调查模式进行数据

持续发展平衡。当前,市场研究利用的调查方式均面采集和研究。探寻一种能够带来成本和效率相互平

临着一些难以突破的瓶颈与痛点。譬如,基于样本招募衡、相互弥补、更高数据质量的调查模式成为整个行

的在线可访问样组(WebAccessPanel),以及基于微信业关注的焦点。本文针对在线可访问样组,微信群、调

群、公众号、调研类App等社会化媒体(SocialMedia)研社区等社会化媒体的非概率样本,以及运营商大数

的抽样调查,能够较为快速、高效、低成本地获取大据抽样框的概率样本等多种来源数据进行混合抽样

量、多样性的样本,但面临样本逐渐固化、职业化,问调查的模式进行较为深人地探索和研究,包括多重抽

卷数据质量下降,以及非概率样本实质上难以进行统样框的编制、具体抽样方案设计,以及通过倾向得分

计推断的挑战。互联网大数据的抽样调查,是基于覆匹配、校准估计等问卷数据融合算法,实现概率-非

盖人群更广泛、更丰富的运营商数据的概率抽样调查,概率样本融合推断目标总体特征,提升调查数据使用

调查数据能够实现对目标总体特征较为精准的推断,效率和数据质量。

包括可以实现下沉城市、高低年龄段、低渗透率消费同时,在理论研究的基础上积极进行产品化实践,

品等目标人群的抽样,但其通过大数据推送问卷调查综合数据质量、实施效率和花费成本等关键因素,基于

的单位成本高,答题存在一定随意性,有不可忽视的机器学习的多目标规划算法搭建“全域用户调研智能

作者简介:王霄(1984—),女,河北张家口人,硕士,数据分析师,研究方向为抽样调查与运作技术;王小宁(1989—),男,山东德州

人,博士,副教授,研究方向为抽样调查与数据整合;柴青慧(1981一),男,吉林延边人,研究方向为抽样调查与运作技术;苏磊

(1976一),男,陕西宝鸡人,硕士,研究方向为抽样调查与运作技术;付晓东(1971一),男,北京人,研究方向为抽样调查与运作技术。

·52·2023年第12期(总第536期)

社会经纬统计理论与实践

您可能关注的文档

文档评论(0)

经管专家 + 关注
实名认证
文档贡献者

各类文档大赢家

版权声明书
用户编号:6055234005000000

1亿VIP精品文档

相关文档