2026年市场调查员数据处理与分析试题及答案解析.docxVIP

  • 0
  • 0
  • 约7.04千字
  • 约 20页
  • 2026-03-14 发布于四川
  • 举报

2026年市场调查员数据处理与分析试题及答案解析.docx

2026年市场调查员数据处理与分析试题及答案解析

1.单选题(每题1分,共20分)

1.在SPSS中,将字符串变量“Q4_1”转换为数值型并保留原标签,最快捷的操作是

A.变量视图→类型→数值→确定

B.转换→重新编码为不同变量→输出变量→粘贴值标签

C.数据→定义变量属性→类型→数值→自动转换

D.语法:ALTERTYPEQ4_1(F8.2).

答案:B

解析:重新编码为不同变量可同时完成类型转换与值标签继承,ALTERTYPE会丢失标签。

2.某品牌NPS调查样本量n=1200,贬损者占18%,被动者占34%,则95%置信度下NPS的近似标准误为

A.2.1%

B.2.6%

C.3.0%

D.3.4%

答案:B

解析:SE≈√[(p?+p?)–(p?–p?)2]/n=√[(0.18+0.48)–(0.18–0.48)2]/1200≈0.026。

3.对5点李克特量表进行主成分分析,KMO=0.52,Bartlett球形检验p=0.001,应

A.放弃因子分析

B.强制提取1个因子

C.继续分析但报告KMO值

D.合并变量后重做

答案:C

解析:KMO0.5且Bartlett显著,可继续,但需在报告中注明适切性一般。

4.在Pythonpandas中,将df的缺失值按列均值填补,正确语句是

A.df.fillna(df.mean(),inplace=True)

B.df.apply(lambdax:x.fillna(x.mean()))

C.df=df.mean().fillna(df)

D.df.fillna(method=mean)

答案:A

解析:df.mean()返回各列均值,fillna直接对齐列索引填补。

5.调查问卷中设置“必答题”主要降低

A.抽样误差

B.无回答误差

C.测量误差

D.覆盖误差

答案:B

解析:必答可减少项目无回答,从而缩小无回答误差。

6.使用交叉表检验“城市等级”与“购买意愿”关联,最恰当的指标是

A.φ系数

B.Cramer’sV

C.列联系数

D.Lambda

答案:B

解析:两变量均为定类且类别数2,Cramer’sV可比性强。

7.在Excel中,对透视表字段“销售额”计算同比增幅,应使用

A.值字段设置→差异百分比→上一个→年

B.值字段设置→%差异→上一个→月

C.计算项→公式=(今年去年)/去年

D.以上均可

答案:A

解析:差异百分比→上一个→年可直接生成同比。

8.若回归模型VIF10,则首先应

A.删除因变量

B.进行岭回归

C.检查样本量

D.增加交互项

答案:B

解析:VIF10表明严重多重共线性,岭回归可稳定系数。

9.在聚类分析中,若轮廓系数为负,说明

A.聚类数过多

B.样本被分配到错误簇

C.变量量纲未统一

D.算法迭代不足

答案:B

解析:负值表示样本到簇内平均距离大于到最近其他簇距离。

10.调查数据加权时,若某层样本量总体层规模,则权重应

A.放大

B.缩小

C.置零

D.不变

答案:B

解析:过抽样需通过权重还原总体比例,权重1。

11.使用双重差分法评估政策效应,前提假设不包括

A.平行趋势

B.政策外生

C.样本随机分组

D.无同时期干扰政策

答案:C

解析:DID不要求随机分组,但要求处理组对照组在政策前趋势一致。

12.在R语言中,使用survey包计算复杂抽样设计的均值,关键函数是

A.svymean

B.svytable

C.svyglm

D.svyttest

答案:A

解析:svymean专门用于估计复杂抽样下的均值及标准误。

13.文本分析中,TFIDF值越高表示

A.词语在文档中占比高且在整个语料中罕见

B.词语在文档中占比低且在语料中常见

C.词语长度长

D.词语情感得分高

答案:A

解析:TFIDF=TF×IDF,兼顾局部频率与全局稀缺性。

14.若Cronbach’sα=0.95,说明

A.量表信度极高但可能冗余

B.量表效度极佳

C.题项间负相关

D.需立即删减题项

答案:A

解析:α过高(0.95)往往提示题项重复。

15.在Tableau中,创建参数控制“TOPN品牌”,应使用

A.集+参数

B.计算字段+参数

文档评论(0)

1亿VIP精品文档

相关文档