中文学科术语相关语义关系获取方法研究l-语言学.pdf

中文学科术语相关语义关系获取方法研究l-语言学.pdf

囤素占馋拓 2017年第2期 · 信 息 技 术 与 系 统 · 中文学科术语相关语义关系获取方法研究 ;l: 朱 惠 1,2 杨建林 1,2 王 吴 0 (1.南京大学信息管理学院 江苏南京 210023) (2.江苏省数据工程与知识服务重点实验室 江苏南京 210023) 摘 要 :文章对 中文非结构化文本 中(半)自动获取学科术语的相关语义关系进行 了探讨 ,以寻找行之有效的获取方 法。从CNKI获取 “数字图书馆”学科领域文献,通过术语抽取、动词抽取 、向量空间模型构建、双重关联规则分析和 规则评价获得 了具有较强关联的术语对 以及作为关联标签的动词.从而获取 了学科术语的相关语义关系 该获取 方法与其他方法相 比.具有较高的可行性和有效性 ,并对术语的相关语义关系进行 了有效性和实用性的评价.提高 了获取的准确率。但文章也存在一定的局限性 .在对术语相关语义关系的有效性和实用性进行评价时.指标的选择 和 阈值 的确定存在人工干预.具有一定的主观性 关键词 :学科术语 ;相关语义关系;数据挖掘 ;关联规则;规则评价 中图分类号 :G202 文献标识码 :A DOI:10.11968/tsyqb.1003—6938.2017041 ResearchontheMethodsofExtractingNon-taxonomicRelation ofChineseDisci- plineTerms AbstractThisparerdiscusseshowto fsemi一)automaticallyextractnon-taxonomicrelationofdisciplinetermsfrom ChineseunstructuredtextSOastofindfeasibleandeffectiveextractingmethods.陆 st,PapersofDigitalLibraryarere— trievedrfom CNⅪ :mentermsandrtnasitiveverbsareextracted;third。vectorspacemodelsraeconstructed;fourth.asso. ciationrulesraeanalyzedandevaluated;andlast,theterm pairswith strongerrelationraeacquirednadthetransitive verbsusedasthelabelsofrelation,thushtenon-taxonomicrelationofChinesedisciplinetermsisextracted.Theabove methodismorefeasibleandeffectivethna ohtermethods。nad itcanimprovetheexrtactingaccuracybyevaluatinghte effectivenessnadpracticality.ThisPaperofcoursehaslimits.W henevaluatinghteeffectivenessnadpracticalitVofas. sociationrules.hteindicatorsnadthresholdsraedeterminedbymanualintervention.SOhtemethodhassubiectivityto som eextent. Keywordsdisciplinetemr s;non——txaonomi crelation;datami ning;associationurles;urlesevaluating 探讨如何从中文非结构化文本中(半)自动获得学科 1 引言 术语的相关语义关系 学科术语 的语义关系总体上可分为两大类 :分 相较于层次语义关系.相关语义关系的获取更 类语义关系 (层次语义关系)和非分类语义关系,本 为困难 .目前国内外对此的研究也较少.常用的获取 文将非分类语义关系称为相关语义关系。层次语义 相关语义关系的方法之一

文档评论(0)

1亿VIP精品文档

相关文档