基于词共现关系强度和关键词词频的叙词选词方法探究.pdfVIP

基于词共现关系强度和关键词词频的叙词选词方法探究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于词共现关系强度和关键词词频的叙词选词方法探究.pdf

第57卷 第15期 2013年8月 基于词共现关系强度和关键词词频的叙词选词方法探究 ■ 浦墨 郑彦宁 赵筱媛 刘志辉 [摘 要]通过计算词共现关系强度,利用基于词共现关系强度和关键词词频的叙词选词方法确定数据通 信领域的叙词候选词,并将其选词结果与基于关键词词频的选词方法选出的叙词候选词进行对比分析,结果显 示:基于词共现关系强度和关键词词频的叙词选词方法选出的叙词候选词比基于关键词词频的叙词选词方法 选出的叙词候选词质量更高。 [关键词]词共现关系强度 关键词词频 叙词候选词 叙词表 [分类号]G254.243   DOI:10.7536/j.issn.0252-3116.2013.15.019 1 引 言 研究不论是在揭示相关性知识方面,还是在挖掘隐性 [6-7] 关联知识方面都有重要实用意义 。在考虑词与词   叙词,也称主题词,即经过规范化处理的,以基 之间的共现关系强弱时,研究者们往往更关注同一篇 [1] 本概念组配方式表达文献主题的主题法类型 。自 文章中共现词汇一同出现的频次,并认为共现词汇在 20世纪50年代末形成叙词法以来,随着叙词表的编 同一篇文章中共现的频率越高,共现词汇之间的关系 制数量不断增长,叙词语言逐步发展成为受控检索 [8] 就越强 。然而,在大量的专业文献中,会出现两个或 [2] 的主要语种 。另外,叙词表的编制和维护也离不 两个以上的关键词一同在不同文章中共现频次也很高 开收词这一基础性工作。传统的叙词表通常采用手 的现象,如在文献集合 C中,会出现关键词 A和关键 工收词方法,各类工具书、专业术语和专业词典以及 词B、C、D…、Z等分别在文献 B1、C1、D1…、Z1等中共 名词委审定词汇等都是手工收词方法的主要来源。 现的情况,其中A与其他词汇共现频次的累加和会很 随着网络和计算机技术的迅速发展,面向网络的收 大,即A与其他词汇共现的频次很高。若根据文献中 词方法也逐渐被探索利用,词的主要来源有:网络数 关键词之间的共现关系构建虚拟的关键词网络图,会 据中的关键词、联网检字法词库、网络热点词、网络 发现关键词A处于关键词网络的某个局部网络的中心 检索界面相关词显示、大众网站的标注词以及网络 位置。如图1所示: 百科资源等。由于网络数据库中的关键词由专业人 员或者作者标引,能够表达文献主题概念的主题词 或叙词,其标引质量比较高[3],故利用网络数据库中 的关键词确定出的叙词候选词准确性比较高。利用 这种方法确定叙词候选词的常规做法是提取文献关 键词,经过去重消歧,并舍弃如“研究”、“应用”、“设 计”等通用词,主要考虑专业词词频,其中的高频词 图1 虚拟关键词网络图的局部图示

文档评论(0)

wdhtm341 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档