- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据背景下受众探究面临挑战和对策
大数据背景下受众探究面临挑战和对策 摘要:传统的受众研究在测量受众媒介使用行为时主要针对随机样本或固定样本进行,样本量有限,调查方式以入户面访、电话访问、日记卡回收等人工测量为主。进入21世纪,随着互联网、尤其是移动互联网技术的迅猛发展,各类智能化手持电子设备逐渐推广普及,智能设备的电子访问记录成为受众研究测量数据的主要来源。本文提出大数据时代受众研究面临的三个挑战,并对应对方法进行了初步探索。
关键词:大数据 受众研究 数据挖掘
受众研究在传播学领域占有突出位置。一方面,它连接着媒介功能和效果研究,几乎每一项重要的效果研究都离不开受众研究;另一方面,它是媒介产业运营中不可或缺的一个环节,是连接传媒产业和广告产业的纽带。进入新世纪以来,面对加速演变的媒介技术,受众研究从未止步。与此同时,一个源自计算机界的技术概念——“大数据”,近年来旋风般“横扫”政治经济社会诸多领域,其能量不容小觑。大数据能给受众研究带来什么?大数据时代受众研究将面临哪些挑战?本文将对这些问题进行深入研究,并探讨应对之策。
一、从小样本到大数据:受众测量技术的升级换代
传统的受众研究在捕捉受众媒介接触、使用行为时主要针对随机样本或固定样本(定期更新)进行,调查方式以入户面访、电话访问、日记卡回收等人工测量为主。即使是20世纪80年代兴起的各种主动、被动测量仪,也是以少数样本为测量对象。进入21世纪,随着互联网、尤其是移动互联网技术的迅猛发展,各类智能化手持电子设备逐渐推广普及,报纸、杂志、广播、电视等传统媒介纷纷通过互联网平台拓展原有传播渠道,受众媒介接触和使用行为日趋多元化、复合化。新兴电子媒体在测量受众媒介使用行为时具有突出优势。作为交互媒体,互联网对于用户的访问都会通过log日志的形式进行记录,而且是以一种旁观者的身份、不必惊动受众的方式进行观察记录。针对智能设备的电子访问记录成为受众研究不断增长的测量数据的主要来源。这些数据符合大数据的主要特征:第一,海量数据。传统受众调查1000个样本就算较大规模,而现在电子设备的访问记录几乎是以普查的方式在进行,伴随移动互联设备和软件的飞速发展,某些热门端点用户访问数量动辄百万、千万,甚至过亿,而且数据量随时间不断增长。第二,高维数据。数据集的维度是数据集合中的对象具有的属性数目,简言之,就是记录单个受众时可能涉及的属性有多少。传统受众调查由于访问成本所限,面向受测样本的问题数量往往精简到最小程度,特别是电话访问时。而现在电子设备对于受众的媒介使用行为可以近乎全方位、无遗漏地详细记录下来;不仅如此,由于苹果、亚马逊等大型公司构建的网上商店系统,受众往往实名注册,大量个人信息与受众媒介使用行为可以进行关联分析,这在过去是难以想象的。第三,数据记录的非目的性。传统受众研究在调查之前有明确的理论框架或商业用途,根据这些既定目标设计相应的需要调查的受众属性。而电子设备访问记录事无巨细地记录受众各种信息和媒介使用行为,并非出于事先规划好的调查目标。
二、大数据背景下受众研究面临的挑战
1.受众媒介使用行为的海量数据,给数据分析带来困难。由于电子设备在记录受众媒介使用行为时并不进行抽样,而是全部纳入测量范围,加之日积月累,因此记录的数据量不再是传统受众研究的兆字节,而是以指数级增长,达到了惊人的吉字节、太字节。这样庞大的数据甚至不能放进计算机内存中运算,而用非内存算法可能相当耗时。而数据更新越来越快,时效性也越来越强,等计算机对海量数据分析出结果,有可能已失去应用价值,难以帮助媒介经营者及时决策。
2.受众媒介使用行为的高维数据,传统统计方法难以应对。传统受众调查常见的是由少量受众属性集合而成的数据,为这些低维数据开发传统的数据分析技术和软件通常不能很好地处理高维数据。现在,研究者往往要面对成百上千的受众属性,中、高维度数据与低维度数据有质的不同,传统统计方法和软件失去用武之地,这就使计算机在分析高维数据时会陷入所谓的维灾难。
3.受众测量数据量非常大,而其中有价值的信息却很少。传统受众调查与统计分析是在有明确研究假设条件或媒介运营指标指导下,精心设计问题收集相应数据,以达到检验假设真假或判断媒介运营成败的目的。因此,数据分析的方法基本上在数据收集之前已确定。现在,研究者事先并不知道在海量多维数据中隐含着哪些有用的信息,就像从矿石中淘金一样,需要应用各种算法探索和揭示隐藏的、未知的规律性,这无疑加大了数据挖掘的难度。
三、受众研究在处理“大数据”时的对策
1.利用抽样技术有效压缩受众测量数据量。抽样是一种选择数据对象子集进行分析的常用方法。在调查研究中,抽样常常用于缩小调查对象或不宜做普查的情形。传统受众研究正是建立在对受众进行抽样调查的基础上。在大数据时代的数
文档评论(0)