- 1
- 0
- 约5.5千字
- 约 17页
- 2026-02-04 发布于四川
- 举报
2026年社会调查与统计分析专业知识测试试题及答案
一、单项选择题(每题2分,共30分)
1.2025年某市对15—65岁常住居民开展时间利用调查,采用“昨日重现法”记录24小时活动。若需推断全市居民平均通勤时间,最合适的抽样方法是
A.简单随机抽样
B.分层PPS抽样
C.二阶段整群抽样
D.系统抽样
答案:B
解析:通勤时间在城市内部呈空间聚集且与就业密度高度相关,分层PPS抽样可按就业中心规模赋予入样概率,兼顾代表性与操作成本。
2.在回归模型Y=β?+β?X?+β?X?+ε中,若X?与X?的VIF分别为8.3与1.2,则首要处理的统计问题是
A.异方差
B.序列相关
C.多重共线性
D.内生性
答案:C
解析:VIF5即表明存在严重多重共线性,X?需考虑剔除或主成分变换。
3.某在线问卷采用“答题时长120秒”作为快速答题清洗规则,该做法最可能引入
A.无回答误差
B.覆盖偏差
C.测量误差
D.选择偏差
答案:D
解析:快速答题者往往具有特定动机或低参与度,直接删除会扭曲样本结构,属于选择偏差。
4.对有序分类变量“教育程度”进行效应编码(effectcoding),若共5类,则基准类的编码向量是
A.(1,1,1,1)
B.(0,0,0,0)
C.(?1,?1,?1,?1)
D.不赋值
答案:C
解析:效应编码要求各类编码之和为0,基准类取?1可保证截距为总均值。
5.2026年国家统计局发布《数据资产入表核算办法》,规定企业数据资产折旧年限为
A.1年
B.3年
C.5年
D.不予折旧
答案:B
解析:数据资产价值衰减快于传统无形资产但慢于软件,3年为折中方案。
6.使用双重差分法评估政策效应,若处理组与对照组在政策前趋势检验p=0.032,则
A.可直接进入双重差分估计
B.需加入个体固定效应
C.应拒绝平行趋势假设
D.改用合成控制法
答案:C
解析:p0.05说明两组事前趋势显著不同,传统DID估计有偏。
7.对零膨胀计数数据建立ZINB模型,若Vuong检验z=2.78,则
A.支持ZINB优于标准负二项
B.支持标准负二项优于ZINB
C.两种模型无差异
D.需进一步做LR检验
答案:A
解析:Vuong|z|1.96即拒绝“两模型等价”原假设,z为正表示ZINB拟合更优。
8.某调查采用“受访者驱动抽样”(RDS),若需估计网络规模,应采集
A.个人度中心度
B.招募券回收数量
C.自我报告通讯录人数
D.同伴招募成功数
答案:C
解析:RDS估计器需每节点自我网络规模作权重,通常直接询问“你认识多少目标人群”。
9.在结构方程模型中,若CFI=0.94,RMSEA=0.05,SRMR=0.06,则
A.模型拟合不佳
B.需释放交叉载荷
C.拟合可接受
D.必须删除潜变量
答案:C
解析:CFI0.90、RMSEA0.06、SRMR0.08同时满足,表明拟合良好。
10.使用LASSO做变量选择,若λ取最小MSE+1SE,则
A.模型最稀疏
B.预测误差最小
C.兼顾解释与预测
D.系数无偏
答案:C
解析:1SE规则在最小MSE基础上进一步压缩系数,降低过拟合风险,实现偏差—方差平衡。
11.对敏感问题采用“随机化回答技术”,若p=0.5概率让受访者回答“是”,则估计真实比例π的公式为
A.π=(λ?p)/(1?p)
B.π=λ/p
C.π=λ(1?p)
D.π=λ+p
答案:A
解析:λ为观测“是”比例,由全概率公式λ=p+(1?p)π反解即得。
12.在Python中使用statsmodels做倾向得分匹配,若caliper=0.05,则
A.匹配半径为0.05个标准差
B.匹配半径为0.05个logit单位
C.匹配半径为0.05个原始单位
D.匹配半径为0.05个方差
答案:B
解析:statsmodels默认caliper基于logit(PS)标准差,0.05即±0.05logit。
13.对社交媒体文本进行情感分析,若采用BERT微调,需重点处理的偏差是
A.地域方言
B.表情符号
C.训练集时效
D.样本选择
答案:C
解析:社交媒体语言演化快,2024年训练模型到2026年可能因新词出现而性能下降。
14.某市建立“数据要素流通平台”,采用“联邦学习+安全多方计算”,其首要满足的伦理原则是
A.知情同意
B.最小够用
C.可解释性
D.公平性
答案:B
解析:联邦学习虽“数据不动模型动”,但仍需确保各方仅获得计算所需最小信息。
15.在R语言survey包中,使用svyglm拟合复杂抽样Logistic回归,若需得到边际效应,应调用
A.m
原创力文档

文档评论(0)