- 2
- 0
- 约3.74千字
- 约 12页
- 2026-07-01 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年网络舆情监测数据处理技巧题集
一、单选题(每题2分,共10题)
主题:舆情数据清洗与预处理技巧——以浙江省电商行业为例
1.在处理浙江省某电商平台关于“假货投诉”的舆情数据时,发现大量用户用“水军”“刷单”等不同词汇表达相同含义。以下哪种方法最适合进行主题聚类?()
A.关键词匹配
B.词性标注
C.聚类分析
D.情感分析
2.浙江某外贸企业发现社交媒体上关于其产品的负面舆情中,部分用户用英文或拼音代替品牌名。若要自动识别这类隐晦表达,应优先采用?()
A.正则表达式匹配
B.机器学习模型训练
C.人工标注筛选
D.关键词联想扩展
3.某监测系统需处理杭州市餐饮行业用户的评论数据,但数据中存在大量“打卡”“推荐”“踩雷”等口语化表达。以下哪种方法最能准确提取用户真实意图?()
A.停用词过滤
B.拼音简写转换
C.语义角色分析
D.词频统计
4.在分析温州制造业企业的舆情数据时,部分用户用“老板”“管理层”等指代企业主体。若要统一归一化处理,最适合采用?()
A.同义词典映射
B.命名实体识别(NER)
C.主题模型
D.情感词典匹配
5.某监测系统需识别浙江省内关于“共同富裕”政策的网络讨论,但发现用户常使用“共同富裕示范区”“共同富裕试验区”等变体表述。以下哪种方法最有效?()
原创力文档

文档评论(0)