全国大学生数据分析科普知识竞赛实操题及答案.docxVIP

  • 1
  • 0
  • 约5.29千字
  • 约 14页
  • 2026-05-07 发布于未知
  • 举报

全国大学生数据分析科普知识竞赛实操题及答案.docx

全国大学生数据分析科普知识竞赛实操题及答案

实操题一:电商商品评论数据获取与初步处理(30分)

任务描述:某电商平台发布了2023年Q3手机品类商品评论数据(模拟数据,链接:/mobile_comments.csv),需完成以下操作:

1.读取CSV文件,查看数据基本信息(行数、列数、各字段类型);

2.识别并处理缺失值(要求:评分字段缺失值用该商品均值填补,评论内容缺失值直接删除对应行);

3.提取评论时间字段中的“月份”信息(如“2023-07-15”提取为7),生成新列“评论月份”;

4.输出处理后数据的前5行。

答案:

1.读取数据与基本信息查看

使用Python的pandas库读取数据并查看基本信息:

```python

importpandasaspd

df=pd.read_csv(/mobile_comments.csv)

print(数据行数:,df.shape[0])输出行数

print(数据列数:,df.shape[1])输出列数

print(各字段类型:\n,df.dtypes)输出字段类型(示例:用户ID(int64)、评论时间(object)、评分(float64)、评论内容(object)、商品ID(int64))

```

2.缺失值处理

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档