- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
主讲人:李亚男旅游产品数据的采集与预处理旅游大数据分析与应用
任务描述旅行社在进行旅游产品设计时,要搜集丰富的旅游线路资源和信息,不仅要关注旅游景区、旅游供应商、旅游者的信息,还要关注当前在售的热门旅游产品和竞争对手在售的旅游产品信息。例如,在旅游产品定价时,可以通过获取在线旅行服务商网站某主题旅游产品的旅游线路列表信息,经过数据采集和预处理后,计算出在售旅游产品的日平均价格,为在线旅游产品设计的成本和价格控制提供参考。
实训任务以携程旅行网上“黄河”相关的旅游产品为例,采用八爪鱼采集器进行数据采集,采用Excel函数与公式进行数据的预处理和计算。1.打开携程旅行网的官方网站的旅游主页(/),在搜索栏输入关键词“黄河”,可以搜索到全部与“黄河”相关的旅游产品列表。通过点击全部、出发地参团、私家团等标签,可以进行产品类别的筛选。通过点击特色体验、出发城市、景点场馆、行程天数等可以根据需要进行产品的组合,筛选出符合需求的旅游产品。
实训任务以携程旅行网上“黄河”相关的旅游产品为例,采用八爪鱼采集器进行数据采集,采用Excel函数与公式进行数据的预处理和计算。2.八爪鱼采集器中的采集任务包括自定义任务和模板任务。首先打开模板任务,搜索是否有携程旅行网的采集模板,搜索结果显示采集模板里没有携程旅游产品的列表采集模板,因此需要采用自定义任务进行信息采集。
实训任务以携程旅行网上“黄河”相关的旅游产品为例,采用八爪鱼采集器进行数据采集,采用Excel函数与公式进行数据的预处理和计算。3.打开自定义任务,输入采集网址,点击保存设置。
实训任务4.采集的目标网页被自动打开,采集器会自动识别并标注可以采集的信息,包括标题、详情、关键词、已售人数、点评、供应商、出发地、价格等信息。点击操作提示中的切换识别结果选择想要采集的信息标签。
实训任务5.点击操作提示的翻页按钮、加载更多按钮和滚动按钮可以设置翻页,采集多页信息。
实训任务6.点击保存并开始采集,系统弹出采集模式选择界面,选择本地采集,数据将保存在本地电脑上。
实训任务7.采集完成后显示共采集1849条数据,其中有154条为重复数据。
实训任务8.点击导出数据---去重数据,选择Excel格式存储数据。
实训任务9.打开导出的Excel表格,查看采集数据详情。
实训任务10.计算黄河旅游产品的日平均价格,需要提取旅游行程天数和价格。
实训任务11.使用Excel中的替换功能,将价格中的“起”字替换为空白。
实训任务12.观察标题中表示行程天数的数字特点,发现在数字位于“日”字的左边。采用Excel文本函数的查找功能,定位“日”字所处的位置。
实训任务13.采用Excel函数的提取功能,提取“日”字左边的字符串。
实训任务14.采用Excel文本函数的提取功能,提取旅游线路天数。
实训任务15.获取行程天数和价格后,便可计算出旅游产品的日平均价格。
谢谢观看THANKYOU
文档评论(0)