一种关于命名实体识别的需求跟踪方法.pdfVIP

  • 3
  • 0
  • 约2.63万字
  • 约 5页
  • 2017-08-28 发布于湖北
  • 举报

一种关于命名实体识别的需求跟踪方法.pdf

第33卷第 1期 计 算 机 应 用 研 究 Vo1.33No.1 2016年 1月 ApplicationResearchofComputers Jan.2016 一 种基于命名实体识别的需求跟踪方法木 王金水 ,薛醒思,唐郑熠 (福建工程学院信息科学与工程学院,福州350108) 摘 要:针对基于文本的需求跟踪方法严重依赖文本质量的问题,提出了一种利用命名实体识别技术标注制品 文档关键词的需求跟踪方法。该方法通过代码实体上下文构建命名实体识别模型,解决了抽象语法树和正则表 达式无法解析非源代码形式的软件制品问题。利用命名实体识别模型标志出软件制品中的代码实体之后,该方 法将软件制品转换为文档集合并进行语义聚类,最后再通过映射算法创建制品间的需求跟踪关系。实验结果表 明,与基于所有词项和基于高权重词项的需求跟踪方法相比,该方法能够有效提高需求跟踪结果的质量。 关键词:需求跟踪;命名实体识别;语义聚类;自然语言处理;权重计算 中图分类号:TP311.5 文献标志码:A 文章编号:1001—3695(2016)01—0132-04 doi:10.3969/j.issn.1001—3695.2016.01.031 Recoveringtraceabilitylinksusingnamedentityrecognition WangJinshui,XueXingsi,TangZhengyi (CollegeofInformationScienceEngineering,FujianUniversityofTechnology,Fuzhou350108,China) Abstract:Aimingattheproblem thatrequirementtraceabilityapproachesbasedontextualinformationwererelyheavilyon thequali~ ofthetext,thispaperproposedatraceabilityapproachutilizednamedentityrecognitiontechnologytoidentifykey wordsinsoftwareartefacts.Firstly,theproposedmethodconstructedanamedentityrecognitionmodelthroughthecontextof codeentity,whichsolvedtheissuethatabstractsyntaxtreeandtheregularexpressionwasnotabletoparsenon-sourceform softwareartefacts.Afterthat,theproposedmethodtransformedsoftwareartefactstodocumentset,andthencarriedoutase— manticclusteringprocesstoclusterdocuments.Finally.theproposedmethodcreatedtracelinksbetweensoftwareartefacts usingthemappingalgorithm.Theexperimentalresultsshowthatcomparingwiththosetraceabilityapproachesbasedontheall temr sandhighweighttemr s,thismethodisabletoeffectivelyimprovethequali~ ofrequirementtracingresults. Keywords:requirementtraceability;namedentityrecognition

文档评论(0)

1亿VIP精品文档

相关文档