3-大数据采集处理与挖掘作业及参考答案.docxVIP

  • 71
  • 0
  • 约2.79千字
  • 约 9页
  • 2022-02-23 发布于四川
  • 举报

3-大数据采集处理与挖掘作业及参考答案.docx

项目三 大数据采集处理与挖掘 任务一 大数据采集 子任务一 报表采集 作业及思考 1.选择任一企业,在金蝶大数据处理平台从东方财富网站中爬取2019和2020年两年的利润表数据做对比。 参考答案 1.以招商银行为例,招商银行的企业代码(完整股票代码)为sh600036。 在“大数据采集”下的“财务报表”页面中,选择数据源为“东方财富”。参数中填写年份“2019,2020”,报表类型选择“利润表”,企业代码(完整股票代码)填写“sh600036”。 点击【运行】,运行完成后查看数据结果并下载excel文件。 子任务二 电商平台评论的采集 作业及思考 1.获取唯品会上其他任一商品的全部历史评价数据,最热的评论排在最前面。 参考答案 以小米体脂称为例,获取需要分析的爆款产品在唯品会网站上的产品查看链接为: /detail-1711297312-6918849116177740352.html 在“大数据采集”下的“电商平台评论数据”页面中,选择数据源为“唯品会”。参数中填写商品链接为前面查询到的产品链接,评论页数不填写(默认为全部页数),每页评论数选择“30”,按点赞数排序选择“降序”。 点击【运行】,运行完成后查看数据结果并下载excel文件。 任务二 大数据处理 子任务一 数据清洗 作业及思考 1.在以上任务的基础上,删除字段“商品价格”、“商品编号”、“评论标签”和

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档