网站大量收购独家精品文档,联系QQ:2885784924

旅游业大数据来源与获取分析.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
旅游业大数据来源与获取分析.doc

PAGE  PAGE 11 旅游业大数据来源与获取分析   旅游业与大数据有着内在的本质的联系,旅游者在旅游过程中的每一个阶段都与数据有关。在旅游活动开始前旅游者就开始了搜集信息,在旅游过程中旅游者又通过社交媒体不断的分享自己的旅游经历,在旅游活动结束之后又面临旅游者的各种活动的反馈。随着互联网及IT技术的飞速发展,旅游者的各种信息在保护隐私的前提下不仅可以完整的保留下来,而且可以用于旅游行业未来的预测以及服务的改进,这也是旅游业大数据研究的基础。在这样的背景下,如何快速有效的获取数据也成为每一位从业人员和科研工作者所困扰的问题。本文从国内外现有案例的基础上总结出目前旅游业大数据的主要来源和获取方式,以期促进我国旅游业大数据研究的发展。   引言   数据是科研工作的重要基础,大数据对与科学研究来说具有不可抗拒的魅力。国内外一些研究者和研究机构都给出了大数据的定义,麦肯锡在其一份商业报告中提出:“大数据指的是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。”Mayer-SchonbergerCukier认为大数据是在因特网广泛发展的基础上产生的不能用传统类型的关系数据库处理的大量数据。ViktorMayer-Sch?nberger认为大数据指不用抽样调查这样的捷径,而采用所有数据进行分析处理。经过多个企业、机构和数据科学家对于大数据的理解阐述,虽然描述不一,但都存在一个普遍共识,即“大数据”的关键是在种类繁多、数量庞大的数据中,快速获取信息。   在旅游研究中,传统意义上的定量研究主要依赖于抽样方法建立模型,通过假设检验从样本推及到总体。在一个资源有限的时代,要收集总体的全部数据需要付出很高的代价,抽样是定量研究的常用方法,因为其方便快捷获得了研究者的偏爱。Nuzzo(2014)对传统定量研究中模型中的假设检验提出了质疑,认为人们在数据量较小的情况下过高的估计了P值的作用。同时,在传统的抽样方法中,抽样的过程往往有可能会存在研究者的偏见和对游客产生影响,导致获取的数据不够客观。大数据记录的是旅游者的平常状态,这也会将研究者对旅游者的影响尽量减小。旅游学科的定量的研究因为大数据的收集与存储发生了变化,数据不再局限于抽样方法获得的小样本,在一定意义上我们甚至可以获得总体的全部数据。在全数据模式下“样本=总体”,社会科学的定量研究方法也将因此产生较大的改变。   社会科学的研究方法不能局限于理论模型的建立,更重要的是获取更完整的数据和处理数据的工具。目前,大部分的研究都集中于数据的存储和分析,大数据的获取问题仍然是一个相对被忽视的领域,但是我们要认识到大数据的获取应该与其他研究一样重要。然而,仅有少数的公司有足够的资源或者能力去获得巨量的数据。因此不仅要掌握分析大数据的技能,更重要的是利用各种技术去收集数据,并把这些非结构化的数据转换为我们可用的信息。   鉴于此,本文从国内外已有的案例出发,对旅游业大数据的获取途径和方法进行梳理,在总结各类方法的主要特点、优劣势、使用范围的基础上,指出目前研究中存在的主要矛盾,以期抛砖引玉,促进我国旅游业大数据研究的进一步发展。   一、旅游业大数据来源分类   旅游意味着旅游者空间位置的变换,当下的旅游者在活动过程中往往会携带一些智能设备(比如手机),并用这些设备与旅游产业进行交互,在交互的过程中将会产生数量非常庞大的数据。根据公众贡献数据的主动性,可以把大数据分为主动式与被动式。其中,主动式大数据主要指旅游电商平台购买后的评价和游记类网站的内容分享,本文中的主动式数据只要指旅游者的用户生成内容(UGC)。被动式大数据是游客在使用智能设备时在运营商或旅游服务提供商后台产生的数据,如使用网站交易数据、搜索引擎、网站的浏览痕迹、旅行GPS轨迹数据、运营商基站数据等,本文把被动式大数据来源分成了三类:搜索引擎,网站分析系统和现代追踪设备。对这些海量多类型数据的获取与分析能够为旅游景区发展与旅游相关领域的研究带来深远影响。   所有的这些信息都可以用来分析旅游者的喜好、动机以及旅游过程中的体验。当我们把所有的这些信息都整合在一起的时候,就会变的更加有说服力。   (一)搜索引擎   目前关于搜索引擎的研究主要集中在计算机科学与信息科学领域,主要关注的焦点是搜索引擎的排序算法。但是我们要认识到,旅游者作为搜索引擎的使用者,网络搜索数据记录了用户的搜索关注与需求,为研究旅游经济行为提供了必要数据基础。搜索引擎已经成为旅游者查询和筛选信息的最重要的途径之一,同时也成为了旅游服务提供商发现潜在的旅游者的最佳方式。   来自于搜索引擎的大数据主要由旅游者的原始查询记录、搜索引擎提供的指数和大数据API三部分组成。Pan,B.(2006)通过Excite公司提供给

文档评论(0)

yingzhiguo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档