- 0
- 0
- 约7.04千字
- 约 20页
- 2026-03-14 发布于四川
- 举报
2026年市场调查员数据处理与分析试题及答案解析
1.单选题(每题1分,共20分)
1.在SPSS中,将字符串变量“Q4_1”转换为数值型并保留原标签,最快捷的操作是
A.变量视图→类型→数值→确定
B.转换→重新编码为不同变量→输出变量→粘贴值标签
C.数据→定义变量属性→类型→数值→自动转换
D.语法:ALTERTYPEQ4_1(F8.2).
答案:B
解析:重新编码为不同变量可同时完成类型转换与值标签继承,ALTERTYPE会丢失标签。
2.某品牌NPS调查样本量n=1200,贬损者占18%,被动者占34%,则95%置信度下NPS的近似标准误为
A.2.1%
B.2.6%
C.3.0%
D.3.4%
答案:B
解析:SE≈√[(p?+p?)–(p?–p?)2]/n=√[(0.18+0.48)–(0.18–0.48)2]/1200≈0.026。
3.对5点李克特量表进行主成分分析,KMO=0.52,Bartlett球形检验p=0.001,应
A.放弃因子分析
B.强制提取1个因子
C.继续分析但报告KMO值
D.合并变量后重做
答案:C
解析:KMO0.5且Bartlett显著,可继续,但需在报告中注明适切性一般。
4.在Pythonpandas中,将df的缺失值按列均值填补,正确语句是
A.df.fillna(df.mean(),inplace=True)
B.df.apply(lambdax:x.fillna(x.mean()))
C.df=df.mean().fillna(df)
D.df.fillna(method=mean)
答案:A
解析:df.mean()返回各列均值,fillna直接对齐列索引填补。
5.调查问卷中设置“必答题”主要降低
A.抽样误差
B.无回答误差
C.测量误差
D.覆盖误差
答案:B
解析:必答可减少项目无回答,从而缩小无回答误差。
6.使用交叉表检验“城市等级”与“购买意愿”关联,最恰当的指标是
A.φ系数
B.Cramer’sV
C.列联系数
D.Lambda
答案:B
解析:两变量均为定类且类别数2,Cramer’sV可比性强。
7.在Excel中,对透视表字段“销售额”计算同比增幅,应使用
A.值字段设置→差异百分比→上一个→年
B.值字段设置→%差异→上一个→月
C.计算项→公式=(今年去年)/去年
D.以上均可
答案:A
解析:差异百分比→上一个→年可直接生成同比。
8.若回归模型VIF10,则首先应
A.删除因变量
B.进行岭回归
C.检查样本量
D.增加交互项
答案:B
解析:VIF10表明严重多重共线性,岭回归可稳定系数。
9.在聚类分析中,若轮廓系数为负,说明
A.聚类数过多
B.样本被分配到错误簇
C.变量量纲未统一
D.算法迭代不足
答案:B
解析:负值表示样本到簇内平均距离大于到最近其他簇距离。
10.调查数据加权时,若某层样本量总体层规模,则权重应
A.放大
B.缩小
C.置零
D.不变
答案:B
解析:过抽样需通过权重还原总体比例,权重1。
11.使用双重差分法评估政策效应,前提假设不包括
A.平行趋势
B.政策外生
C.样本随机分组
D.无同时期干扰政策
答案:C
解析:DID不要求随机分组,但要求处理组对照组在政策前趋势一致。
12.在R语言中,使用survey包计算复杂抽样设计的均值,关键函数是
A.svymean
B.svytable
C.svyglm
D.svyttest
答案:A
解析:svymean专门用于估计复杂抽样下的均值及标准误。
13.文本分析中,TFIDF值越高表示
A.词语在文档中占比高且在整个语料中罕见
B.词语在文档中占比低且在语料中常见
C.词语长度长
D.词语情感得分高
答案:A
解析:TFIDF=TF×IDF,兼顾局部频率与全局稀缺性。
14.若Cronbach’sα=0.95,说明
A.量表信度极高但可能冗余
B.量表效度极佳
C.题项间负相关
D.需立即删减题项
答案:A
解析:α过高(0.95)往往提示题项重复。
15.在Tableau中,创建参数控制“TOPN品牌”,应使用
A.集+参数
B.计算字段+参数
原创力文档

文档评论(0)