传播学视角下计算文本分析可供性探究:一项范围性回顾.pdfVIP

  • 5
  • 0
  • 约3.66万字
  • 约 18页
  • 2025-10-21 发布于江西
  • 举报

传播学视角下计算文本分析可供性探究:一项范围性回顾.pdf

新媒体与网络2025年6月第2卷第2期

DOI:10.20233/j.cnki.xmtwl.202502004

传播学视角下计算文本分析可供性探究:

一项范围性回顾

杨帆,张海龙,邓梦月

西安交通大学新闻与新媒体学院,陕西西安710049

摘要计算文本分析已成为传播学研究的重要工具,但由于其跨学科特性及技术

复杂性,关于其可供性的理解仍较为有限。通过范围性回顾,系统分析了2020—

2024年间在社会科学引文索引(SSCI)传播学期刊上发表的相关文献,聚焦计算

文本分析的技术可供性,分别考察了文本分类、主题建模、语义空间化和多模态

分析在传播学中的应用。研究发现,传播学者普遍关注所采用技术与研究目的、

情境和数据的适配性。针对四个研究方向,建议从准确性、可解释性、叙事性和

可用性四个维度深化对技术可供性的认识。最后探讨了大模型时代计算文本分析

在传播学中的应用趋势。

关键词计算传播;文本分析;技术可供性;多模态;大型语言模型

文献标识码A文章编号2097-4248(2025)02-0034-18

当今社会,互联网、社交媒体、科学文献等各种渠道产生了海量文本,这些文本既可

以作为量化研究的数据来源,也可以作为计算叙事的分散元素。而手动分析海量文本的成

本无疑是巨大的,因此借助自然语言处理(naturallanguageprocessing,NLP)实现文本的

自动化分析被寄予厚望。一方面,传播学者通过掌握R、Python和其他编程语言的开源

NLP库分析海量文本;另一方面,信息技术企业也在努力开发满足传播学者需求的低技术

门槛产品。双方的相向而行,极大促进了近年来计算传播学的快速发展。

在计算文本分析发展的早期,虽然实现自动化并达到了量的飞跃,但是自动化分析的

质远不如人类。许多传播学者,尤其是政治传播领域的学者较早对此进行了探索。

收稿日期2025-04-07。

基金项目教育部人文社会科学研究项目(22XJC860002)。

作者简介杨帆,男,西安交通大学新闻与新媒体学院副教授;张海龙,男,西安交通大学新闻与新媒体学

院硕士研究生;邓梦月,女,西安交通大学新闻与新媒体学院硕士研究生。

34

杨帆,张海龙,邓梦月传播学视角下计算文本分析可供性探究:一项范围性回顾

[1]

Grimmer等列出了计算文本分析的四条原则:所有的语言模型都是错的,但其中一些是

有用的;自动化分析增强人类而非取代人类;不存在十全十美的计算文本分析方法;必须

对自动化分析结果进行验证。这是因为早期的语言模型大都基于词袋(bag-of-words)模

型,对于语境复杂的文本,其准确性不尽如人意。

随着深度学习的发展,NLP分析结果的质也不断突破,在许多任务中表现出近乎或超

[2]

越人类的水准。即便如此,Baden等指出,计算文本分析在社会科学领域仍面临三大挑

战:一是过分依赖技术而忽视验证的重要性;二是过于专注于特定任务而缺乏通用性;三

是对英语的过度关注而忽视其他语言。这些挑战部分归因于目前广泛使用的基于变换器

(transformer)的双向编码器表示(BERT)的NLP模型主要面向单一任务设计,在应用广

度和多语言处理能力方面存在固有局限。然而,随着大型语言模型的兴起,如今计算文本

分析逐步克服这些挑战,这为计算传播研究带来了前所未有的潜力和广阔的应用前景。

虽然计算文本分析迎来了“量质齐飞”的发展,但是选择适合自己研究的技术路线仍

然是困扰许多计算传播学者的一个问题。伴随量质提升的是其背后复杂的技术原理,这对

传播学者理解其技术可供性提出了挑战。基于此,本文对近年来传播学领域涉及计算文本

分析的文章进行了范围性回顾,分别从文本分类、主题建模、语义空间化、多模态分析四

类应用方向论述了计算文本分析如何赋能传播学研究,此外还探讨了大型语言模型在文本

分析领域的应用和发展趋势。

一、理论视角

[3]

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档