- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于词共现关系强度和关键词词频的叙词选词方法探究.pdf
第57卷 第15期 2013年8月
基于词共现关系强度和关键词词频的叙词选词方法探究
■ 浦墨 郑彦宁 赵筱媛 刘志辉
[摘 要]通过计算词共现关系强度,利用基于词共现关系强度和关键词词频的叙词选词方法确定数据通
信领域的叙词候选词,并将其选词结果与基于关键词词频的选词方法选出的叙词候选词进行对比分析,结果显
示:基于词共现关系强度和关键词词频的叙词选词方法选出的叙词候选词比基于关键词词频的叙词选词方法
选出的叙词候选词质量更高。
[关键词]词共现关系强度 关键词词频 叙词候选词 叙词表
[分类号]G254.243
DOI:10.7536/j.issn.0252-3116.2013.15.019
1 引 言 研究不论是在揭示相关性知识方面,还是在挖掘隐性
[6-7]
关联知识方面都有重要实用意义 。在考虑词与词
叙词,也称主题词,即经过规范化处理的,以基
之间的共现关系强弱时,研究者们往往更关注同一篇
[1]
本概念组配方式表达文献主题的主题法类型 。自
文章中共现词汇一同出现的频次,并认为共现词汇在
20世纪50年代末形成叙词法以来,随着叙词表的编
同一篇文章中共现的频率越高,共现词汇之间的关系
制数量不断增长,叙词语言逐步发展成为受控检索 [8]
就越强 。然而,在大量的专业文献中,会出现两个或
[2]
的主要语种 。另外,叙词表的编制和维护也离不
两个以上的关键词一同在不同文章中共现频次也很高
开收词这一基础性工作。传统的叙词表通常采用手
的现象,如在文献集合 C中,会出现关键词 A和关键
工收词方法,各类工具书、专业术语和专业词典以及
词B、C、D…、Z等分别在文献 B1、C1、D1…、Z1等中共
名词委审定词汇等都是手工收词方法的主要来源。
现的情况,其中A与其他词汇共现频次的累加和会很
随着网络和计算机技术的迅速发展,面向网络的收
大,即A与其他词汇共现的频次很高。若根据文献中
词方法也逐渐被探索利用,词的主要来源有:网络数
关键词之间的共现关系构建虚拟的关键词网络图,会
据中的关键词、联网检字法词库、网络热点词、网络
发现关键词A处于关键词网络的某个局部网络的中心
检索界面相关词显示、大众网站的标注词以及网络
位置。如图1所示:
百科资源等。由于网络数据库中的关键词由专业人
员或者作者标引,能够表达文献主题概念的主题词
或叙词,其标引质量比较高[3],故利用网络数据库中
的关键词确定出的叙词候选词准确性比较高。利用
这种方法确定叙词候选词的常规做法是提取文献关
键词,经过去重消歧,并舍弃如“研究”、“应用”、“设
计”等通用词,主要考虑专业词词频,其中的高频词
图1 虚拟关键词网络图的局部图示
您可能关注的文档
- 基于GPS观测分析日本9.0级地震同震位错与近场形变特征.pdf
- 基于Hurst指数的矿化强度识别-以山东大尹格庄金矿为例.pdf
- 基于InternetIntranet的既有建(构)筑物可靠性分析与评判系统研究.pdf
- 基于LMI的建筑结构地震动H2H∞混合控制.pdf
- 基于Logistic总体Ⅱ型截尾样本分布参数的极大似然估计.pdf
- 基于MATLAB的均质土坡稳定可靠度的蒙特卡罗模拟.pdf
- 基于maxent的两种入侵性鱼类(麦穗鱼和鲫)的全球适生区预测.pdf
- 基于MonteCarlo模拟的矿岩块度预测.pdf
- 基于NNs-MRAS无速度传感器双馈电机LQR控制.pdf
- 基于Novozhilov-柔度理论的连续弯箱梁桥位移参数Kalman滤波识别.pdf
- 基于贝叶斯概率预报的水库汛限水位实时动态控制研究brReal-Time Dynamic Control of Reservoir Flood Limited Water Level Based on the Bayesian Probabilistic Forecasting Processor.pdf
- 基于通用运动模型的五轴机床后置处理.pdf
- 基于钻孔数据的矿山三维地质建模及可视化过程研究.pdf
- 基于间歇精馏回收废溶剂中二甲苯醋酸丁酯.pdf
- 基于马尔科夫链先验模型的贝叶斯岩相识别.pdf
- 基于高精度修磨轮包络精化圆柱蜗杆的理论研究.pdf
- 基于高速公路计重收费系统的货车实际费率计算模型.pdf
- 基体强度与氮化钢的疲劳.pdf
- 基岩-高贝利特水泥混凝土现场抗剪(断)性能.pdf
- 堤坝下软基土工织物加筋机理分析.pdf
文档评论(0)