信息系统模拟数据生成与研究.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息系统模拟数据生成与研究.ppt

信息系统模拟数据生成研究 报告人:崔晓鹏 一、简述信息系统模拟数据 信息系统在试验、试用、演练中需要数据支持,但常常不宜使用真实数据。 出于安全性考虑,不允许使用真实数据。为了解决这一问题,在某些场合常采用一些简单变换对真实数据伪装,但伪装数据通过逆变换可以复原为真实数据,仍然存在安全隐患,同时,有些伪装数据会降低数据的合理性,影响应用效果。 一、简述信息系统模拟数据 信息系统在试验、试用、演练中需要数据支持,但常常不宜使用真实数据。 出于时间或成本要求,难以使用真实数据。真实数据需要按照一定的流程获取,并要有相应人员、装备保障,还要有最低限度的时间保证,在有时间限制或投入受限的情况下,难以获取满足要求的真实数据。 一、简述信息系统模拟数据 信息系统在试验、试用、演练中需要数据支持,但常常不宜使用真实数据。 不同任务有具体的数据需求,真实数据不能满足应用。信息系统的试验、试用、演练任务目标明确,也需要与目标相适应的数据支持。 一、简述信息系统模拟数据 通常,已有的真实数据并不一定立足于本次任务的数据需求所获得,在完整性、及时性、可用性、相关性、效用性等方面与实际数据需求存在偏差。 鉴于以上原因,信息系统模拟数据生成的现实需求日益迫切,应采用合理模型与算法,用计算机模拟的方式快速生成模拟数据,以满足信息系试验、试用、演练的实际需要。 二、信息系统模拟数据生成的研究定位 软件测试数据生成 一般意义上,软件测试是为了发现错误而执行程序的过程。顾名思义,软件测试数据是用于软件测试的数据。测试数据生成可以被理解为一个抽样过程,即根据相应的测试覆盖标准,采用一定的方法,在测试数据全集中进行抽样,选取出一批错误敏感的测试数据,使它们具有满足要求的发现软件错误的可能性。 二、信息系统模拟数据生成的研究定位 样本数据扩充 在数据挖掘、可靠性评估等研究中,要求样本量足够大,而获取足够量的真实样本数据常常很困难。传统统计学所研究的是一种渐进理论,由此提出的各种方法只有当样本数目趋向于无穷大时,其性能才有理论上的保证。即使是近年发展起来的针对小样本的支持向量机理论,仍需要一定量的训练数据进行训练。 二、信息系统模拟数据生成的研究定位 虚拟现实 虚拟现实(virtual reality)是以计算机技术为核心,结合相关科学技术,生成与一定范围真实环境在视、听、触感等方面高度近似的数字化环境,用户借助必要的设备与数字化环境中的对象进行交互作用、相互影响,用以产生亲临对应真实环境的感受和体验。 二、信息系统模拟数据生成的研究定位 信息系统模拟数据生成 依据不同的开发应用阶段,信息系统中的数据可以分成测试数据、模拟数据和真实数据。测试数据即为软件测试数据,真实数据是系统真正投入使用所需的数据以及运转过程中产生的数据。模拟数据又叫演练数据,指信息系统在试验、试用、演练中使用的非真实数据,这类数据对信息系统而言又具有相当的真实性。信息系统模拟数据生成是用计算机模拟的方式快速生成信息系统模拟数据。从时效性、安全性、经济性的角度,在许多场景下都需要生成信息系统模拟数据。 三、信息系统模拟数据生成的特点 在同一个信息系统的开发应用周期内,可能前三种数据生成需求并存,但是,以上四者具有明显区别: 任务需求不同 生成过程不同 处理数据不同 任务目标不同 四、信息系统模拟数据生成的研究内容 数据生成需求分析 每一个具体的信息系统模拟数据生成任务,在实施数据生成之前,都要进行详细的需求分析,给数据生成提供依据。需求分析应包括充分理解用户的数据生成需求,就具体的生成数据质量与数据用户达成一致,并最终形成模拟数据生成详细实施方案。 四、信息系统模拟数据生成的研究内容 数据生成方法研究 以当前最为典型的信息系统关系型模拟数据生成为例。关系型数据不但具有严格的结构,并且各属性值之间存在各种数据内部依赖,数据生成需要发现并描述这些依赖关系,实现数据生成,使生成的数据保持所要求的依赖关系。因此,对于不同类型的属性,有必要分别研究相应的生成方法。 四、信息系统模拟数据生成的研究内容 生成数据的评价 数据生成之后,有必要对生成数据与模拟数据生成需求的符合性、可用性等进行评价。具体评价方法分为主观定性评价和客观定量评价。主观定性评价可以请用户或有经验的专家从不同角度打分评价,客观定量评价通过计算生成数据的特征参数指标值进行评价,最后往往需要综合主观评价与客观评价给出最终的评价结论。 四、信息系统模拟数据生成的研究内容 生成数据的私密性与安全性 所生成的关系型数据,不可能完全消除原数据集的真实信息以及一些领域信息。事实上,有时也往往要求所生成的模拟数据保留部

文档评论(0)

wdhtm341 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档