- 479
- 0
- 约1.85万字
- 约 40页
- 2022-12-26 发布于湖北
- 举报
西安与郑州火锅团购数据分析
目标
(1)分析西安郑州两地的年销量对比分析;
(2)两地在火锅消费中的菜品特征;
(3)绘制两地热门评论的词云图;
(4)模型分析
插入库
In?[?]:
import matplotlibmatplotlib.rcParams[font.sans-serif] = [SimHei] # 显示中文# 为了坐标轴负号正常显示。matplotlib默认不支持中文,设置中文字体后,负号会显示异常。需要手动将坐标轴负号设为False才能正常显示负号。
matplotlib.rcParams[axes.unicode_minus] = False## 前期准备:加载所需工具包import pandas as pdimport numpy as npimport osimport matplotlib.pyplot as pltimport seaborn as snsimport jiebaimport jieba.analyseimport collectionsimport squarifyfrom PIL import Imagefrom wordcloud import WordCloud, ImageColorGeneratorimport statsmodels.formula.api as smffrom IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = all #变量自动显示pd.set_option(display.max_columns, None) #显示所有列
数据准备以及数据说明
本次实践采用截止2018年8月1日某团购平台上西安与郑州火锅团购数据进行分析,共1345条团购数据和44845条评论数据。通过本次实践,结合店铺信息、团购基本信息、图片信息和使用规则,探究如何进行团购设置已提供团购项目的销量。数据文件包括:
1)comment.xlsx:评论数据44845条
2)group_buying.xlsx:团购信息1345条
3)group_buying_processed.xlsx:预处理后的团购信息1345条
In?[?]:
path = ../datadata = pd.read_excel(os.path.join(path, group_buying.xlsx)) #读取团购数据comment = pd.read_excel(os.path.join(path, comment.xlsx)) #读取评论数据
In?[?]:
data.info() #查看data的数据量、缺失情况及数据类型comment.info() #查看comment的数据量、缺失情况及数据类型
class pandas.core.frame.DataFrame
RangeIndex: 1345 entries, 0 to 1344
Data columns (total 37 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 Unnamed: 0 1345 non-null int64
1 团购活动ID 1345 non-null int64
2 团购名称 1345 non-null object
3 店名 1345 non-null object
4 购买人数 1345 non-null int64
5 团购评分 1345 non-null float64
6 团购评价数 1345 non-null int64
7 团购价 1345 non-null float64
8 市场价 1345 non-null float64
9 内容丰富度 1345 non-null int64
10 是否为代金券 1345 non-null int64
11 有效期 1345 non-null int64
12 是否周末节假日通用 1345 non-null int64
13 是否需要预约 1345 no
您可能关注的文档
最近下载
- 2025年版维医医师资格考试大纲.docx VIP
- 常用汉字表(2500字).pdf VIP
- 高中英语2025届高考热点环保主题作文素材(词汇+模板).doc VIP
- 2026年春季统编版(部编版)2024新教材二年级下册道德与法治教学计划、教学设计及教学反思(附目录).docx
- 高中英语2025届高考热点青少年心理健康主题作文固定搭配短语汇总.doc VIP
- (2025春)部编版一年级下册道德与法治全册教案 (新版本).docx
- 国家电网招聘考试综合能力(判断推理)模拟试卷2.docx VIP
- 运动损伤与康复-全套PPT课件.pptx
- 凌文铨组织承诺问卷.doc VIP
- 医美整形现场咨询绝对成交技巧话术.docx VIP
原创力文档

文档评论(0)