网站大量收购闲置独家精品文档,联系QQ:2885784924

汉语词同现网络的小世界效应和无标度特性刘知远,孙茂松.pdf

汉语词同现网络的小世界效应和无标度特性刘知远,孙茂松.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉语词同现网络的小世界效应和无标度特性刘知远,孙茂松

汉语词同现网络的小世界效应和无标度特性 刘知远,孙茂松 (清华大学计算机科学与技术系,清华信息科学与技术国家实验室,北京 100084 ) 摘 要:人类语言的某些重要方面可以通过复杂网络来刻画。本文基于不同规模和类型的语料库,建立了汉语 词同现网络,并从复杂网络的角度对这些网络进行了系统的实验考察。实验结果表明汉语词同现网络具有复杂 网络的两个基本性质:(1) 网络的平均最短路径为2.63-2.75 ,聚合系数远大于相同参数下的随机网络,这揭示了 汉语同现网络的小世界效应;(2) 网络中词的度大体上呈幂律分布,表明汉语同现网络具有无标度特性。本文还 对实验中所得到的汉语核心词典进行了定量分析。 关键词:词的同现;复杂网络;小世界;无标度;核心词典 中图分类号:TP391 Chinese Word Co-occurrence Network: Its Small World Effect and Scale-free Property Liu Zhi-yuan, Sun Mao-song (Department of Computer Science and Technology, Tsinghua University, Beijing 100084) Abstract :Some perspectives of human languages can be characterized by complex network analysis. In this paper, word co-occurrence networks for the Chinese language are automatically constructed based on very large manually word-segmented Chinese corpora with different size and style at first. Then systematic observations on these networks are made from the complex network’s point of view. Experimental results show that these networks display two important features of complex networks: (1) The average distance between two words is 2.63-2.75, and the clustering coefficient is much greater than that given by a random network with the same parameters, exhibiting a typical small-world effect; and (2) The degree distributions of these networks generally obey the power-law, i.e., the scale-free property. Related factors of kernel lexicons derived from these experiments are also discussed in a quantitative way. Keywords: word co-occurrence; complex networks; small world; scale-free; kernel lexicon 1.引言 自然界和人类社会中的大量复杂系统,如生态网、神经网、Internet 、社会网络等,越来越成为相关学科的 研究热点。复杂网络理论则试图在这些互不相同的复杂网络之中找出它们的共性规律。 20世纪的后40年里,Erdos和Renyi[1]建立的随机图理论(ER模型)一直是人们研究复杂网络

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档