传播学视角下计算文本分析可供性探究：一项范围性回顾.pdfVIP

下载本文档

5
0
约3.66万字
约 18页
2025-10-21 发布于江西
举报

传播学视角下计算文本分析可供性探究：一项范围性回顾.pdf

新媒体与网络2025年6月第2卷第2期

DOI:10.20233/j.cnki.xmtwl.202502004

传播学视角下计算文本分析可供性探究：

一项范围性回顾

杨帆，张海龙，邓梦月

西安交通大学新闻与新媒体学院，陕西西安710049

摘要计算文本分析已成为传播学研究的重要工具，但由于其跨学科特性及技术

复杂性，关于其可供性的理解仍较为有限。通过范围性回顾，系统分析了2020—

2024年间在社会科学引文索引（SSCI）传播学期刊上发表的相关文献，聚焦计算

文本分析的技术可供性，分别考察了文本分类、主题建模、语义空间化和多模态

分析在传播学中的应用。研究发现，传播学者普遍关注所采用技术与研究目的、

情境和数据的适配性。针对四个研究方向，建议从准确性、可解释性、叙事性和

可用性四个维度深化对技术可供性的认识。最后探讨了大模型时代计算文本分析

在传播学中的应用趋势。

关键词计算传播；文本分析；技术可供性；多模态；大型语言模型

文献标识码A文章编号2097-4248（2025）02-0034-18

当今社会，互联网、社交媒体、科学文献等各种渠道产生了海量文本，这些文本既可

以作为量化研究的数据来源，也可以作为计算叙事的分散元素。而手动分析海量文本的成

本无疑是巨大的，因此借助自然语言处理（naturallanguageprocessing，NLP）实现文本的

自动化分析被寄予厚望。一方面，传播学者通过掌握R、Python和其他编程语言的开源

NLP库分析海量文本；另一方面，信息技术企业也在努力开发满足传播学者需求的低技术

门槛产品。双方的相向而行，极大促进了近年来计算传播学的快速发展。

在计算文本分析发展的早期，虽然实现自动化并达到了量的飞跃，但是自动化分析的

质远不如人类。许多传播学者，尤其是政治传播领域的学者较早对此进行了探索。

收稿日期2025-04-07。

基金项目教育部人文社会科学研究项目（22XJC860002）。

作者简介杨帆，男，西安交通大学新闻与新媒体学院副教授；张海龙，男，西安交通大学新闻与新媒体学

院硕士研究生；邓梦月，女，西安交通大学新闻与新媒体学院硕士研究生。

杨帆，张海龙，邓梦月传播学视角下计算文本分析可供性探究：一项范围性回顾

［1］

Grimmer等列出了计算文本分析的四条原则：所有的语言模型都是错的，但其中一些是

有用的；自动化分析增强人类而非取代人类；不存在十全十美的计算文本分析方法；必须

对自动化分析结果进行验证。这是因为早期的语言模型大都基于词袋（bag-of-words）模

型，对于语境复杂的文本，其准确性不尽如人意。

随着深度学习的发展，NLP分析结果的质也不断突破，在许多任务中表现出近乎或超

［2］

越人类的水准。即便如此，Baden等指出，计算文本分析在社会科学领域仍面临三大挑

战：一是过分依赖技术而忽视验证的重要性；二是过于专注于特定任务而缺乏通用性；三

是对英语的过度关注而忽视其他语言。这些挑战部分归因于目前广泛使用的基于变换器

（transformer）的双向编码器表示（BERT）的NLP模型主要面向单一任务设计，在应用广

度和多语言处理能力方面存在固有局限。然而，随着大型语言模型的兴起，如今计算文本

分析逐步克服这些挑战，这为计算传播研究带来了前所未有的潜力和广阔的应用前景。

虽然计算文本分析迎来了“量质齐飞”的发展，但是选择适合自己研究的技术路线仍

然是困扰许多计算传播学者的一个问题。伴随量质提升的是其背后复杂的技术原理，这对

传播学者理解其技术可供性提出了挑战。基于此，本文对近年来传播学领域涉及计算文本

分析的文章进行了范围性回顾，分别从文本分类、主题建模、语义空间化、多模态分析四

类应用方向论述了计算文本分析如何赋能传播学研究，此外还探讨了大型语言模型在文本

分析领域的应用和发展趋势。

一、理论视角

［3］

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

传播学视角下计算文本分析可供性探究：一项范围性回顾.pdfVIP