- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉语语义场网络中的无标度分布现象.ppt
汉语语义场网络中的无标度分布现象 杨华1 姬东鸿*2 萧国政1 1武汉大学文学院 武汉 430070 2武汉大学计算机学院 武汉 430070 即时通信:QQ与微信:905018910(高品低智) 摘 要 词语在与其密切相关的其它词语处在一个系统中时,能表现出其系统意义与自身的含义(义位)。这个系统称为语义场。汉语语义场指的是汉语中的词语意义联系在一起构成的语义系统。一门语言的所有子语义场合在一起,就是这门语言的语义场。 本文探索用复杂网络来表示汉语的(子)语义场,根据联想场的概念,提出用复杂网络表示汉语的子语义场,并获得了该网络的一些统计特性。 无标度分布在复杂网络研究领域的文献中一般描述的是网络的节点度分布。但我们发现,在带权值的语义场网络中,除了节点的度,节点的权值与边的权值均展现了无标度分布。 通过观察网络结点的度、结点的权值、边的权值在一定范围内的内容,可以观察到一些仅在网络的视角才能发掘出的语言现象。我们将较为特别的现象展示给语言学界的专家们,期望引起共鸣,或许从专业的语言学家那里,可以得到对这些现象的解释,从而推进其在自然语言处理任务中的应用。 1引言 近年来,复杂网络用来描述现实世界中种种复杂系统。 语言是人类进化中长期演化出的高度复杂系统。过去对语言的统计特性研究往往基于一阶统计,比如Zipf定理。 近年来,学者们将语言建模为网络进行研究,尝试从网络的角度去探索语言的性质及认知过程、模拟人类语言的产生过程。 观察到了大量在一阶统计上难以察觉的语言和认知心理的现象,并用于解释语言的根源、认知过程等等。 1引言 汉语是世界最重要的语言之一,其统计规律和性质在语言学上具有重要的参考意义。 汉语网络的研究已有一些初步的进展 如基本词法网络 汉词语同现网络 汉词语汇的语法依存句法网络[5]。 实验表明这些网络拓扑结构表现出复杂网络的许多普适特性,并且与其它语言网络特性非常相似。这说明尽管各种语言有自己的词法和句法,但是它们后面隐藏着内在的、相对固定的规律。也说明网络是挖掘这些规律的有力工具。 1引言 汉语语义场指的是汉语中的词语意义联系在一起构成的语义系统。基于联想语义场的思想,我们构建汉语的(子)语义场网络,观察到该网络中的无标度分布,并观察了网络中结点和边的内容,展现了从网络角度探测到的语言现象。 1引言 本文的组织结构如下: 第2节概览了目前普遍研究的语言复杂网络; 第3节介绍了联想语义场的概念,并基于该概念介绍了语义场网络的构建方法; 第4节描述了在语义场网络中所调查的特性 第5节给出了实验结果,即网络中普遍出现的无标度分布现象,其中对于节点权值、边权值的分布的研究是尤其独特的,并观测了某些特定范围的词语特征。 第6节指出了未来的工作。 2语言复杂网络一览 很多文献中将语言的复杂网络称为语义网络(Semantic Network),这个概念不等同于“语义网(Semantic Web)”。 2语言复杂网络一览 单词同现(相邻)网和单词搭配网 依存语法网: 词典网络――专家知识网: 词汇联想网络: 中文语言网络的相关工作: 共性:小世界效应和无标度特性,并在层次性、居间中心性和混合模式 ,具有普适特性 3语义场网络 很多研究对以什么单位为网络结点,如何定义结点之间的关系,研究的兴趣何在都未充分回答。 然而,尽管各种已研究网络从构建上有区别,但都有一个共同点:结点之间的关系都试图表达词语之间的语义关联。然而,什么样的两个词语算是“具有语义上的关联”呢? 3.1联想场的概念 索绪尔曾说过:“任何一个词在人们的记忆力都可以唤起一切可能跟它有这种或那种联系的词。”联想场的概念是有索绪尔的弟子Bally提出的,Bally正式提出了联想场理论认为:包围在已给词周围的能够更细地规定这个词的价值的体系。 Ullmann把联想场规定为围绕一个词的联想网络,一切都是被联想的网所包围,依此和其他词产生联系,这种联想是有意义关系的,有纯粹根据形态的,也有和形态,意义双方都相关的[26][27]。这正是本文的灵感来源。 3.2 如何表达联想 为什么给定激发词“奥运会”,大多数人会联想到“金牌”,“世界冠军”等等呢? 笔者认为,这种心理过程构建于人共有的背景知识,因而间接地构建于广泛使用的媒体,包括报纸,电视,网络等。更具体来说,是因为这些词语高概率地在同一窗口中同现。词语的同现是重要信息[28],这一观点获得了广泛的应用。 注意到常常同现的词语放在一起时能表现它们自己的含义,比如“刘翔”、“跑步”、“冠军”三个词语放在一起的时候,尽管没有句法信息,我们仍能判断这里“刘翔”是著名运动员而非一般人,“跑步”是一种高水平的比赛,而不是普通的“奔跑”。这些词放在一起的时候,即使没有精确的人
您可能关注的文档
最近下载
- 制定手机使用协议书.docx VIP
- 隐形矫正培训课件.pptx VIP
- 2025年高考化学一轮复习:物质的分类及转化(讲义)解析版.pdf VIP
- 2023中华护理学会团体标准-老年人误吸的预防.pptx VIP
- 《Rubis软件2017版》操作手册.pdf VIP
- 标准图集-08CJ17快速软帘卷门 透明分节门 滑升门 卷帘门.pdf VIP
- 消化内科-病历讨论.pptx VIP
- (⼈教2019版)化学 选必1 第三单元 水溶液中的离子反应与平衡 大单元教学设计.docx
- SHT 3525-2015 石油化工低温钢焊接规范.pdf VIP
- Q/CRRC J26-2018- 轨道交通装备产品禁用和限用物质.pdf VIP
文档评论(0)