网站大量收购独家精品文档,联系QQ:2885784924

汉语词语时代特征的自动获取和利用研究--先秦和现代.pdf

汉语词语时代特征的自动获取和利用研究--先秦和现代.pdf

  1. 1、本文档共62页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉语词语时代特征的自动获取和利用研究--先秦和现代

摘要 I III IIIIIIIII IIIl 111111ILIIIIII 摘要 传统意义上说,词语的时代特征(或称为“时代色彩”)能够体现词语所在 社会的发展状况和时代气息,但该定义却会导致“词语的时代特征就是时代”这 个结论。我们认为词语的时代特征理应包含其诞生、成长直到消亡的全过程。这 样能够从更全面的角度考察词语变化发展的面貌,也便于我们进行客观的量化研 究。时代特有词语是一类特殊的词语,是研究词语时代特征重要的一个方面,也 是词语时代特征研究中最有价值的一个方面。本文分别从先秦和现代汉语语料入 手,主要使用TF和TFIDF值获取先秦和现代汉语特有词语,并以此为基础研究 了自动获取(也就是量化)词语时代特征的有效方法,实验表明我们的方法是令 人满意的。时代特征是词语附加义中重要的组成部分,自然语言理解的重点和难 点就是对于语义的理解,如果能够能有效解决词语的时代附加义的自动获取与理 解,将对自然语言处理中的语义研究有很大的帮助。我们还在词语时代特征的基 础上,进行了应用研究,使用向量相似度和朴素贝叶斯分别对先秦25种文献年 代进行自动判断,实验结果表明朴素贝叶斯分类器的性能更好,是一种有效的判 定文献年代的方法。 关键词: 先秦,现代汉语,词汇,时代特征,年代判定,向量空间 模型 Abstract Abstract Intraditional oftimesisan of meanings,words’propertyimportanttype additional which the oftimes.Butthiswill toa meaningrepresentsspirit lead conclusion oftimes meanstimes”.Wesaw of thatwords’property words’property timesasawholefrom totheir this of words’appearance view, disappearance.Inpoint wecan the more a studywords’changing comprehensively.Andquantification methodon oftimesismucheasier.Peculiaroftimesmost words’property words are inthe of oftimes.Westartedwith important studywords’property pre—Qincorpus and ModemChineseandwelearnedthatTFand TFIDF didwellin corpus

文档评论(0)

yxutcangfp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档