2025国考深圳调查队数据分析与软件应用上机模拟题.docxVIP

2025国考深圳调查队数据分析与软件应用上机模拟题.docx

本文档由用户AI专业辅助创建,并经网站质量审核通过
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第PAGE页共NUMPAGES页

2025国考深圳调查队《数据分析与软件应用》上机模拟题

第一部分:数据处理与分析(共3题,每题10分,总计30分)

说明:本部分题目要求根据给定数据集,运用Excel或Python等工具进行数据处理与分析,并回答相关问题。

1.【数据清洗与整理-10分】

题目:

某深圳调查队收集了2024年深圳市居民消费支出调查数据(数据集见附件,文件名“深圳居民消费支出.csv”),包含变量:`户别`(城镇/农村)、`年龄组`(18-25岁、26-35岁、36-45岁等)、`支出类别`(食品、住房、交通通信等)、`支出金额`(元)。

要求:

(1)删除数据集中包含缺失值的样本;

(2)将`支出类别`统一转换为小写,并添加新变量`支出类别_编码`(食品=1,住房=2,交通通信=3,其他=4);

(3)计算城镇和农村居民在“食品”类别的平均支出金额,并比较差异。

答案与解析:

(1)数据清洗步骤:

-使用Excel的`删除重复项`功能去除完全重复行;

-使用`条件格式`或`查找与替换`功能统一`支出类别`的大小写;

-使用`筛选`或`高级筛选`删除包含缺失值的样本(如`支出金额`为空)。

(2)数据整理步骤:

-使用`文本分列`或`VLOOKUP`函数将`支出类别`转换为小写;

-编写Python代码实现`支出类别_编码`:

python

defencode_category(category):

ifcategory.lower()==食品:

return1

elifcategory.lower()==住房:

return2

elifcategory.lower()==交通通信:

return3

else:

return4

(3)差异分析:

-使用Excel的`数据透视表`或Python的`pandas`库分组计算:

python

importpandasaspd

data=pd.read_csv(深圳居民消费支出.csv)

data.dropna(subset=[支出金额],inplace=True)

data[支出类别_编码]=data[支出类别].apply(encode_category)

food_expense=data[data[支出类别_编码]==1]

urban_food_avg=food_expense[food_expense[户别]==城镇][支出金额].mean()

rural_food_avg=food_expense[food_expense[户别]==农村][支出金额].mean()

print(f城镇食品平均支出:{urban_food_avg}元,农村食品平均支出:{rural_food_avg}元)

-差异结论:根据计算结果,城镇居民食品支出显著高于农村居民,可能与收入水平差异有关。

2.【统计描述与可视化-10分】

题目:

某深圳调查队收集了2024年深圳市各区居民收入数据(数据集见附件,文件名“深圳各区居民收入.xlsx”),包含变量:`区`(福田、罗湖、南山等)、`人均收入`(元)、`收入中位数`(元)。

要求:

(1)绘制深圳市各区“人均收入”的柱状图,并标注最高和最低收入区;

(2)计算人均收入和收入中位数的均值、标准差,并分析收入分布的离散程度;

(3)若某企业计划在深圳市设立分店,基于收入数据提出选址建议。

答案与解析:

(1)可视化步骤:

-使用Excel的`插入`→`图表`功能创建柱状图;

-在图表中添加数据标签,并用箭头标注最高(如南山)和最低(如坪山)收入区。

(2)统计描述:

-使用Excel的`描述统计`功能或Python的`pandas`库:

python

importpandasaspd

importnumpyasnp

data=pd.read_excel(深圳各区居民收入.xlsx)

mean_income=data[人均收入].mean()

std_income=data[人均收入].std()

print(f人均收入均值:{mean_income}元,标准差:{std_income}元)

-分析:若标准差较大,说明各区收入差异明显,南山收入远高于坪山。

(3)选址建议:

-优先选择人均收入较高的区(如南山、福田),但需结合成本考虑;

-若目标客户为中低收入群体,可考虑坪山、光明等区,但需补充消费能力分析。

3.【数据分组与趋势分析-10分】

题目:

某深圳调查队收集了2020-2024年深圳市新能源汽车销量数据(数据集见附件,文件名“深圳新能源汽车销量.csv”),包含变量:`年份`(2

文档评论(0)

墨倾颜 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档