西安与郑州火锅团购数据分析-2.docxVIP

  • 38
  • 0
  • 约1.61万字
  • 约 50页
  • 2022-12-26 发布于湖北
  • 举报
赵欣 赵欣 学号:2105210097 | 经研2103班 Python数据分析实践报告 西安与郑州火锅团购数据分析 目录 TOC \o 1-2 \h \u 22799 西安与郑州火锅团购数据分析 0 4247 目标 1 4615 实现 1 24458 插入库以及相关库的介绍与说明 1 25528 数据准备以及数据说明 2 10871 数据处理 5 20495 变量处理 7 22204 一 、西安郑州两地的年销量对比:(可视化结果分析及说明) 9 28046 西安各分类变量与年均销量的关系: 11 13566 郑州各分类变量与年均销量的关系: 30 21927 西安各连续变量与年均销量的关系: 49 32426 郑州各连续变量与年均销量的关系: 51 21207 二、两地在火锅消费中的菜品特征; 52 22561 郑州的热门菜品: 54 13442 三、绘制两地热门评论的词云图; 55 17813 西安的评论词云: 56 7914 郑州的评论词云: 56 12207 四、模型分析并提出建议 57 8125 西安的建模结果: 58 15982 郑州的建模结果: 60 21501 提出的建议: 61 22799 西安与郑州火锅团购数据分析 目标 (1)分析西安郑州两地的年销量对比分析; (2)两地在火锅消费中的菜品特征; (3)绘制两地热门评论的词云图; (4)模型分析 插入库以及相关库的介绍与说明 In [ ]: import matplotlib matplotlib.rcParams[font.sans-serif] = [SimHei] # 显示中文 # 为了坐标轴负号正常显示。matplotlib默认不支持中文,设置中文字体后,负号会显示异常。需要手动将坐标轴负号设为False才能正常显示负号。 matplotlib.rcParams[axes.unicode_minus] = False ## 前期准备:加载所需工具包 import pandas as pd #主要用于数据处理,获取描述统计信息,数据框的聚合运算 import numpy as np #对多维数组执行计算 import os #提供通用的,基本的操作系统交互功能 import matplotlib.pyplot as plt #在平台上以各种硬拷贝格式和交互式环境生成出具有出版品质的图形 import seaborn as sns #辅助matplotlib import jieba #获取词组 import jieba.analyse import collections #用于集合的相关操作 import squarify #将数据生成基于matplotlib的树状图可视化 from PIL import Image from wordcloud import WordCloud, ImageColorGenerator import statsmodels.formula.api as smf from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = all #变量自动显示 pd.set_option(display.max_columns, None) #显示所有列 数据来源以及数据说明 本次实践采用截止2018年8月1日某团购平台上西安与郑州火锅团购数据进行分析,共1345条团购数据和44845条评论数据。通过本次实践,结合店铺信息、团购基本信息、图片信息和使用规则,探究如何进行团购设置已提供团购项目的销量。数据文件包括: 1)comment.xlsx:评论数据44845条 2)group_buying.xlsx:团购信息1345条 3)group_buying_processed.xlsx:预处理后的团购信息1345条 class pandas.core.frame.DataFrame RangeIndex: 1345 entries, 0 to 1344 Data columns (total 37 columns): # Column Non-Null Count Dtype 0 Unnamed: 0 1345 non

文档评论(0)

1亿VIP精品文档

相关文档