描述与比较分析查询关系表达式: 新的工业需求质量数据集.pdfVIP

  • 0
  • 0
  • 约3.49万字
  • 约 8页
  • 2026-03-06 发布于北京
  • 举报

描述与比较分析查询关系表达式: 新的工业需求质量数据集.pdf

描述与比较分析查询关系表达式:

新的工业需求质量数据集

HenningFemmerFrankHoudek

SouthWestphaliaUniversityMercedes-BenzAG

ofAppliedSciencesSindelfingen,Germany

Hagen,Germanyfrank.houdek@

femmer.henning@fh-swf.de

MaxUnterbusch,AndreasVogelsang

paluno–TheRuhrInstituteforSoftwareTechnology

UniversityofDuisburg-Essen

本Essen,Germany

译{max.unterbusch,andreas.vogelsang}@uni-due.de

1

v

8“需求异味”的概念被引入以识别可能的质量问题模式,

6Abstract—需求质量是成功软件和系统工程的核心。关于从而促进快速质量保证过程[5]。

8自然语言需求中质量问题的实证研究严重依赖于数据集,理想情

8尽管有大量的研究,但提供带有质量相关标签的自

0况下这些数据集应尽可能现实且具有代表性。然而,这样的数据

.然语言需求的公开可用数据集却很少。许多现有的数据

8集往往难以获取、样本量小或缺乏足够的细节。本文介绍了一个

0新的数据集查询请求(需求质量),该数据集包含2,111个经过集无法访问、规模有限、缺乏严格的标注标准,或者不

5实际审查过程标注的工业需求。此前作为工业合同的一部分使用能反映真实世界工业环境。这一限制阻碍了研究人员验

2

:了超过五年时间,现在这个数据集被发布给研究社区。在本项工证发现、比较方法以及开发用于质量评估的数据驱动工

v

i作中,我们还提供了对该数据集的描述性统计信息,包括词汇多具。此外,标准化数据集的缺失妨碍了旨在理解和改进

x

r样性、可读性等指标,并将其与现有的需求数据集和人工生成的

a需求进行了比较。与合成数据集相比,查询结果在语言上与现有需求质量的经验研究的发展[4]。

数据集相似。然而,该数据集附带详细的上下文描述,其标签在为了解决这一缺口,我们提出了查询关系表达式

工业环境中系统且广泛地创建和使用了近十年时间。我们的目标(夸alityin重新quirements),这是一个由来自真实世

是通过支持开发需求质量数据集的通用金标准来促进透明度、可界汽车项目的2,111个自然语言需求组成的综合数据

比性和实证严谨性。这反过来将使该领域的研究工作更加稳健和集。每个需求都附有从工业审查过程衍生的质量缺陷标

协作。

签,确保了其真实性和实际相关性。该数据集是同类中

IndexTerms—需求工程,需求质量,需求数据集,基准

最大的公开可用资源,并为学术研究和工业应用提供了

测试

宝贵的见解。除了发布数据集外,我们还进行了与现有

I.介绍

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档