- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第PAGE页共NUMPAGES页
2025国考深圳调查队《数据分析与软件应用》上机模拟题
第一部分:数据处理与分析(共3题,每题10分,总计30分)
说明:本部分题目要求根据给定数据集,运用Excel或Python等工具进行数据处理与分析,并回答相关问题。
1.【数据清洗与整理-10分】
题目:
某深圳调查队收集了2024年深圳市居民消费支出调查数据(数据集见附件,文件名“深圳居民消费支出.csv”),包含变量:`户别`(城镇/农村)、`年龄组`(18-25岁、26-35岁、36-45岁等)、`支出类别`(食品、住房、交通通信等)、`支出金额`(元)。
要求:
(1)删除数据集中包含缺失值的样本;
(2)将`支出类别`统一转换为小写,并添加新变量`支出类别_编码`(食品=1,住房=2,交通通信=3,其他=4);
(3)计算城镇和农村居民在“食品”类别的平均支出金额,并比较差异。
答案与解析:
(1)数据清洗步骤:
-使用Excel的`删除重复项`功能去除完全重复行;
-使用`条件格式`或`查找与替换`功能统一`支出类别`的大小写;
-使用`筛选`或`高级筛选`删除包含缺失值的样本(如`支出金额`为空)。
(2)数据整理步骤:
-使用`文本分列`或`VLOOKUP`函数将`支出类别`转换为小写;
-编写Python代码实现`支出类别_编码`:
python
defencode_category(category):
ifcategory.lower()==食品:
return1
elifcategory.lower()==住房:
return2
elifcategory.lower()==交通通信:
return3
else:
return4
(3)差异分析:
-使用Excel的`数据透视表`或Python的`pandas`库分组计算:
python
importpandasaspd
data=pd.read_csv(深圳居民消费支出.csv)
data.dropna(subset=[支出金额],inplace=True)
data[支出类别_编码]=data[支出类别].apply(encode_category)
food_expense=data[data[支出类别_编码]==1]
urban_food_avg=food_expense[food_expense[户别]==城镇][支出金额].mean()
rural_food_avg=food_expense[food_expense[户别]==农村][支出金额].mean()
print(f城镇食品平均支出:{urban_food_avg}元,农村食品平均支出:{rural_food_avg}元)
-差异结论:根据计算结果,城镇居民食品支出显著高于农村居民,可能与收入水平差异有关。
2.【统计描述与可视化-10分】
题目:
某深圳调查队收集了2024年深圳市各区居民收入数据(数据集见附件,文件名“深圳各区居民收入.xlsx”),包含变量:`区`(福田、罗湖、南山等)、`人均收入`(元)、`收入中位数`(元)。
要求:
(1)绘制深圳市各区“人均收入”的柱状图,并标注最高和最低收入区;
(2)计算人均收入和收入中位数的均值、标准差,并分析收入分布的离散程度;
(3)若某企业计划在深圳市设立分店,基于收入数据提出选址建议。
答案与解析:
(1)可视化步骤:
-使用Excel的`插入`→`图表`功能创建柱状图;
-在图表中添加数据标签,并用箭头标注最高(如南山)和最低(如坪山)收入区。
(2)统计描述:
-使用Excel的`描述统计`功能或Python的`pandas`库:
python
importpandasaspd
importnumpyasnp
data=pd.read_excel(深圳各区居民收入.xlsx)
mean_income=data[人均收入].mean()
std_income=data[人均收入].std()
print(f人均收入均值:{mean_income}元,标准差:{std_income}元)
-分析:若标准差较大,说明各区收入差异明显,南山收入远高于坪山。
(3)选址建议:
-优先选择人均收入较高的区(如南山、福田),但需结合成本考虑;
-若目标客户为中低收入群体,可考虑坪山、光明等区,但需补充消费能力分析。
3.【数据分组与趋势分析-10分】
题目:
某深圳调查队收集了2020-2024年深圳市新能源汽车销量数据(数据集见附件,文件名“深圳新能源汽车销量.csv”),包含变量:`年份`(2
您可能关注的文档
- 2025国考宁波金融监管局在职官员推荐阅读书目及考点提炼.docx
- 2025国考乌鲁木齐市刑事技术岗位申论高频考点及答案.docx
- 2025国考上海证监局备考记忆口诀大全法规数字流程.docx
- 2025国考南通长航公安结构化小组面试礼貌反驳与补充话术.docx
- 2025国考拉萨市日语翻译岗位行测预测卷及答案.docx
- 2025国考青岛证券基金机构监管岗必备知识与考题.docx
- 2025上海国考行测定义判断之民航警务专业术语题库.docx
- 2025国考青岛金融监管局行测政治理论高频考点及答案.docx
- 2025国考太原市价格监管岗位申论题库含答案.docx
- 2025国考深圳市劳动监察岗位申论模拟题及答案.docx
最近下载
- 新质生产力赋能云南高原特色现代农业高质量发展的路径研究.docx VIP
- 博世:以文化为基因,提升领导力 – 博世高潜人才发展与教练文化.pdf VIP
- 儿童发育性协调障碍的筛查、评估和诊断指南(2025).pptx VIP
- GBT 29611-2013 生橡胶 玻璃化转变温度的测定 差示扫描量热法(DSC).pdf
- NB_T 20160-2021 压水堆核电厂不锈钢水池覆面施工技术规程.pdf VIP
- 2025党校入党积极分子发展对象考试题库(含答案).docx VIP
- (电厂)三级安全教育考试题(附含答案).docx VIP
- 施工现场平面布置及施工道路平面图.pdf VIP
- 2015办公用品采购表申请表做办公用品采购流程.doc VIP
- 例谈基于语篇分析的中学英语阅读教学设计.pdf VIP
原创力文档


文档评论(0)