2026中级统计师统计专业知识和实务题及答案.docxVIP

  • 1
  • 0
  • 约7.23千字
  • 约 17页
  • 2026-03-14 发布于四川
  • 举报

2026中级统计师统计专业知识和实务题及答案.docx

2026中级统计师统计专业知识和实务题及答案

一、统计调查设计与数据收集

【单选】1.某市欲了解居民网购频率,拟采用分层抽样。已知该市有8个城区,各城区人口规模差异显著,且网购渗透率与城区经济水平高度相关。下列做法最能有效控制估计量方差的是()。

A.按城区人口规模分层,每层内简单随机抽样

B.按城区经济水平排序后系统抽样

C.按城区经济水平分层,每层内按人口规模成比例抽样

D.先按经济水平分层,再在各层内按网购渗透率分层二次分层

答案:C

解析:分层抽样中,层间差异越大、层内差异越小,方差降低效果越明显。经济水平与目标变量高度相关,应作为分层变量;而人口规模差异大,采用成比例抽样(PPS)可使大城区样本量自动增加,进一步降低方差。A仅考虑人口规模,未利用经济水平信息;B为系统抽样,无法保证层内同质;D二次分层增加复杂度,但经济水平已高度相关,边际收益低。

【多选】2.下列关于“网络抓取数据”与“官方行政记录”差异的说法,正确的有()。

A.网络抓取数据通常为非概率样本

B.行政记录具有法律强制填报属性,覆盖更完整

C.网络抓取数据时间粒度更细,可做到实时更新

D.行政记录字段定义与统计制度完全一致,无需清洗

E.网络抓取数据可直接用于推断总体参数,无需加权

答案:A、B、C

解析:行政记录虽字段规范,但部门间统计口径常需清洗转换,D错;网络抓取数据为非概率样本,需依赖模型加权或敏感性分析才能推断总体,E错。

【案例】3.某县农业农村局欲监测2025年夏粮亩产,考虑成本,决定以无人机遥感测产为主、地面实测为辅。

(1)设计抽样框时,发现遥感影像可识别12000个种植地块,但缺乏农户权属信息。以下哪项做法最能降低无回答误差?()

A.直接以地块为抽样单位,无人机飞行当日电话询问农户确认

B.先与村委会核对地块权属,再预约入户实测

C.以村为初级单元,二阶段抽取地块,村委会配合提前告知

D.仅对连片50亩以上大户地块抽样,忽略小户

答案:C

解析:二阶段抽样可利用行政体系降低无回答;村委会提前告知提高配合度;A当日联系失败率高;B逐村核对成本高;D忽略小户导致覆盖偏差。

(2)若无人机测产误差服从N(0,σ2),地面实测误差服从N(0,τ2),且两者独立。欲组合两类数据得到最小方差无偏估计,则最优权重应为()。

A.τ2/(σ2+τ2)

B.σ2/(σ2+τ2)

C.1/σ2:1/τ2

D.σ2:τ2

答案:A

解析:设无人机估计为??,地面为??,则最优组合?=w??+(1?w)??,方差最小化解得w=τ2/(σ2+τ2),即对精度高的来源(方差小)给予更大权重。

二、数据清洗与质量控制

【单选】4.某数据库10万条职工记录,字段“年龄”取值范围为[16,100],但存在0.3%的缺失。下列插补方法中,引入偏差风险最小的是()。

A.用全体职工年龄均值插补

B.用同一部门、同性别、同岗位年龄中位数插补

C.用hotdeck在同性别、同教育水平层内随机抽取插补

D.直接用35岁统一插补

答案:C

解析:hotdeck在相似单元内随机抽取,保持变量联合分布,偏差最小;A忽略组间差异;B中位数虽稳健,但确定性插补会低估方差;D人为常数偏差最大。

【多选】5.统计机构在建立“数据质量仪表盘”时,下列指标中属于“过程质量”维度的是()。

A.报表迟报率

B.字段缺失率

C.逻辑审核规则通过率

D.最终发布修正幅度

E.调查员培训合格率

答案:A、C、E

解析:B、D属于“结果质量”维度;A、C、E反映生产流程是否受控。

【案例】6.某电商平台2025年5月订单表出现“订单时间戳”字段异常,表现为1.2%记录显示00:00:00。

(1)最先应执行的核查步骤是()。

A.直接删除异常记录

B.比对上游业务系统日志,确认是否为系统批量补单

C.用正则表达式统一修正为

D.标记为缺失,进入插补流程

答案:B

解析:先溯源确认异常原因,再决定修正策略;A造成信息损失;C可能掩盖业务真实补单逻辑;D未查明原因即插补,风险高。

(2)若确认该异常为系统bug,且补单真实存在,但时间戳被默认赋值为32日。统计5月GMV时,下列做法正确的是()。

A.将32日记录纳入5月汇总

B.将32日记录

文档评论(0)

1亿VIP精品文档

相关文档