近三百年中国城市的国际知名度基于大数据的描述与回归.docxVIP

近三百年中国城市的国际知名度基于大数据的描述与回归.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
近三百年中国城市的国际知名度基于大数据的描述与回归 近三百年中国城市的国际知名度基于大数据的描述与回归 近三百年中国城市的国际知名度基于大数据的描述与回归 近三百年中国城市的国际知名度基于大数据的描述与回归 陈云松 吴青熹 张 翼 摘 要:本文利用谷歌图书的百万书籍大数据,以中国地级以上(含)城市近300年来英语书籍中出现的词频来展示和分析城市国际知名度的变迁及其特征。研究发现,北京、香港、上海、广州、南京、澳门、天津、台北、重庆和拉萨依次为近300年国际知名度的前十强。在此基础上,本文进一步对基于书籍大数据的国际知名度和媒体提及率进行基于时间序列回归的格兰杰因果检验。研究表明,近代中国大陆城市在国际媒体中的提及率显著影响其国际知名度,而港澳台城市的国际知名度和媒体提及率之间则不存在这种关联。这意味着近代以来大陆城市的国际传播主要通过媒体报道进入西方社会。本文最后总结了中国城市国际知名度获得过程的模式和特征。 关键词:大数据 国际知名度 城市 文化传播 城市是人类文明在地理空间上的汇聚点,具有文化的贮存、传播、交流、创造和发展等基本功能(Mumford,1961)。在城市的诸多内涵要素中,城市文化是城市的灵魂。作为文化在地理空间上的重要载体,一座城市在全球范围内的知名度是城市综合影响力的重要组成部分。一个国家的城市群体的影响力,是衡量国家的非权力性影响力,也即软实力的重要指标 (Nye,1990)。因此,对城市文化影响力尤其是国际知名度的研究,具有重要的经济、社会和政治内涵。不过,囿于数据和测量的局限,学界迄今尚未对这一领域有过系统的分析和探索。例如,即便是对当代城市知名度进行分析,海外抽样问卷的方法也需要较大的成本且面临样本选择的问题,而如果要观察几个世纪以来城市知名度的变迁轨迹,传统的抽样数据和分析方法就更无法实现。 “大数据”尤其是数字化书籍大数据的适时出现,为开展相关的社会科学研究提供了空前的机遇(陈云松等,2021)。目前,谷歌图书(Google Books)语料库能提供公元1500年以来7种语言800多万种数字化书籍的全文词频检索(Michel, et al., 2021; Lin, et al., 2021)。通过观测和分析关键词在语料库中使用频率的变化,我们可以发现相关的关键词在人类文化发展史中或鲜为人知或饶有趣味的趋势和现象。国际语言学界、历史学界对此已经开始进行跨学科探索(Bentley, et al., 2021;Acerbi, et al., 2021;Twenge, et al., 2021)。国内学者也已利用这一数据,对跨度百年的社会文化现象进行历史轨迹描述和量化分析(陈云松,2021;Chen and Yan, 2021)。 本文首先以谷歌图书1700年以来的百万英语书籍作为语料库,以中国大陆全部直辖市、副省级以上城市、省会城市、各地级市以及港澳台主要城市英文名称作为关键词,以这些关键词在语料库中每年出现的频率高低为指标,在纵向跨度300年、横向跨度达千亿词汇的文化大数据中,精确描绘上述各城市词频位次的变迁及特征。鉴于英语是近百年来全球使用范围最广和最重要的通用语言之一,而积累数世纪的海量书籍则构成数百年里国际社会知识、观念和经验的最重要载体,因此我们认为,基于谷歌图书百万英语书籍语料库的城市词频,可以用来作为测量城市国际知名度的标尺。 在构建国际知名度测度的基础上,我们进一步对中国城市国际知名度的积累渠道进行分析。近代以降,囿于交通、信息传输技术和成本以及清政府在政治、经济、文化和外交上的闭关锁国政策,绝大多数中国城市与西方社会直接的人流、物流互动非常有限。因此,我们提出中国城市群体国际知名度形成的“差异化”假说。具体而言,近代以来中国大陆城市的国际知名度多受到西方当时主要媒体(报纸)提及率的影响,而对于香港、澳门和台北等曾经有过较长殖民地历史的中国城市而言,该关联并不显著:殖民统治使得这些城市直接成为中西文化对撞的窗口,从而具有与大陆城市(没有殖民地历史或殖民地历史较短)不同的知名度获得途径。为检验这一假说,本研究从《纽约时报》全文数据库中提取中国城市提及率指标,并将其与国际知名度指标进行了基于时间序列回归的格兰杰因果关系分析,以观察两者的统计关联在大陆城市和港澳台三城市之间有无差异。本文既是对城市国际知名度进行大数据测量的首次尝试,也是中国社会科学领域较早利用大数据进行的计量模型回归分析。 二、概念及测量 (一)城市的国际知名度 现有文献中城市的国际知名度仅局限于当代,多被量化为国际展览次数、知名搜索网站可搜索信息条数、利用外资和外资企业数量等指标(如马继刚等,2021;李红波等,2021)。而且

文档评论(0)

亦起学 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体湖北亦贤科技有限公司
IP属地陕西
统一社会信用代码/组织机构代码
91421023MA4F181CXD

1亿VIP精品文档

相关文档