2026年市场调查员数据处理与分析试题及答案解析.docxVIP

下载本文档

0
0
约7.04千字
约 20页
2026-03-14 发布于四川
举报

2026年市场调查员数据处理与分析试题及答案解析.docx

2026年市场调查员数据处理与分析试题及答案解析

1.单选题（每题1分，共20分）

1.在SPSS中，将字符串变量“Q4_1”转换为数值型并保留原标签，最快捷的操作是

A.变量视图→类型→数值→确定

B.转换→重新编码为不同变量→输出变量→粘贴值标签

C.数据→定义变量属性→类型→数值→自动转换

D.语法：ALTERTYPEQ4_1(F8.2).

答案：B

解析：重新编码为不同变量可同时完成类型转换与值标签继承，ALTERTYPE会丢失标签。

2.某品牌NPS调查样本量n=1200，贬损者占18%，被动者占34%，则95%置信度下NPS的近似标准误为

A.2.1%

B.2.6%

C.3.0%

D.3.4%

答案：B

解析：SE≈√[(p?+p?)–(p?–p?)2]/n=√[(0.18+0.48)–(0.18–0.48)2]/1200≈0.026。

3.对5点李克特量表进行主成分分析，KMO=0.52，Bartlett球形检验p=0.001，应

A.放弃因子分析

B.强制提取1个因子

C.继续分析但报告KMO值

D.合并变量后重做

答案：C

解析：KMO0.5且Bartlett显著，可继续，但需在报告中注明适切性一般。

4.在Pythonpandas中，将df的缺失值按列均值填补，正确语句是

A.df.fillna(df.mean(),inplace=True)

B.df.apply(lambdax:x.fillna(x.mean()))

C.df=df.mean().fillna(df)

D.df.fillna(method=mean)

答案：A

解析：df.mean()返回各列均值，fillna直接对齐列索引填补。

5.调查问卷中设置“必答题”主要降低

A.抽样误差

B.无回答误差

C.测量误差

D.覆盖误差

答案：B

解析：必答可减少项目无回答，从而缩小无回答误差。

6.使用交叉表检验“城市等级”与“购买意愿”关联，最恰当的指标是

A.φ系数

B.Cramer’sV

C.列联系数

D.Lambda

答案：B

解析：两变量均为定类且类别数2，Cramer’sV可比性强。

7.在Excel中，对透视表字段“销售额”计算同比增幅，应使用

A.值字段设置→差异百分比→上一个→年

B.值字段设置→%差异→上一个→月

C.计算项→公式=(今年去年)/去年

D.以上均可

答案：A

解析：差异百分比→上一个→年可直接生成同比。

8.若回归模型VIF10，则首先应

A.删除因变量

B.进行岭回归

C.检查样本量

D.增加交互项

答案：B

解析：VIF10表明严重多重共线性，岭回归可稳定系数。

9.在聚类分析中，若轮廓系数为负，说明

A.聚类数过多

B.样本被分配到错误簇

C.变量量纲未统一

D.算法迭代不足

答案：B

解析：负值表示样本到簇内平均距离大于到最近其他簇距离。

10.调查数据加权时，若某层样本量总体层规模，则权重应

A.放大

B.缩小

C.置零

D.不变

答案：B

解析：过抽样需通过权重还原总体比例，权重1。

11.使用双重差分法评估政策效应，前提假设不包括

A.平行趋势

B.政策外生

C.样本随机分组

D.无同时期干扰政策

答案：C

解析：DID不要求随机分组，但要求处理组对照组在政策前趋势一致。

12.在R语言中，使用survey包计算复杂抽样设计的均值，关键函数是

A.svymean

B.svytable

C.svyglm

D.svyttest

答案：A

解析：svymean专门用于估计复杂抽样下的均值及标准误。

13.文本分析中，TFIDF值越高表示

A.词语在文档中占比高且在整个语料中罕见

B.词语在文档中占比低且在语料中常见

C.词语长度长

D.词语情感得分高

答案：A

解析：TFIDF=TF×IDF，兼顾局部频率与全局稀缺性。

14.若Cronbach’sα=0.95，说明

A.量表信度极高但可能冗余

B.量表效度极佳

C.题项间负相关

D.需立即删减题项

答案：A

解析：α过高（0.95）往往提示题项重复。

15.在Tableau中，创建参数控制“TOPN品牌”，应使用

A.集+参数

B.计算字段+参数

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年市场调查员数据处理与分析试题及答案解析.docxVIP