- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4 输入数据建模 4.1 建立输入数据模型的方法 建立输入数据模型可以采用如下三种方法之一: (1)在仿真运行中直接使用收集到的数据 (2)把收集到的数据定义为经验分布 (3)将数据拟合为某种理论分布 输入数据建模 原始数据 (1)在仿真运行中直接使用收集到的数据 该方法很直接,也可以用来做确定性模型的有效性检验,但是有两个缺点: (1)只能用收集到的历史数据来驱动仿真模型; (2)经常没用足够多的数据来进行多次仿真试验。 (2)把收集到的数据定义为经验分布 该方法可以根据实际数据值的范围、某个数据值出现的频率,用随机数来产生所需要的随机变量值,能够产生足够多的数据来进行多次仿真试验。 (3)将数据拟合为某种理论分布 如果发现所收集的数据能够较好地服从某种理论分布(Theoretical Distribution),倾向于采用第 3种方法而不是第2种方法。 建立输入数据理论分布的几个主要步骤 收集原始数据 基本统计分布的辨识 参数估计以 拟合度检验 4.2 收集原始数据 一、收集输入数据的方法 (1)通过实际观测获得系统的输入数据。 (2)由项目管理人员提供的实际系统运行数据。 (3)从已经发表的研究成果、论文中收集类似系统的输入数据模型。 二、收集数据时,要注意以下几点: (1)在收集数据的同时就分析数据,确定收集到的数据是否足够。 (2)将性质相同的数据集组合在一起。 (3)确定两个随机变量是否相关。 (4)注意一组观测到的、似乎是独立的样本是否具有自相关性。 4.3 随机变量分布的辨识 4.3.1 连续型随机变量分布类型辨识 (1)点统计法 点统计法确定连续随机变量分布类型的基本思路为,首先计算连续型随机变量的偏差系数,再根据偏差系数的特征寻求与其相近的理论分布,并假设随机变量的分布为这一理论分布。 偏差系数是偏差与均值的比: 如果有随机变量X,则有: 其中: ——随机变量采集数据的均值; s2(n) ——随机变量采集数据的方差。 (2)直方图法 直方图是一种图形估计方法。 基本原理是:用观测到的样本数值建立随机变量的概率密度函数分布的直方图,然后把得到的直方图与理论分布的概率密度函数曲线图形做对比,从图形上直观地判断被观测随机变量是否满足某种理论分布。 具体做法: 1)将所有观测数值分为k个区间长度相等的相邻区间。 [bj-1,bj),j=1,2,…,k。 区间宽度Δb=bj-bj-1 2)对于第i个区间[bj-1,bj),令gj表示在第j个区间中的观测数据数量nj占整个观测数据的比例,即gj= nj/n。 3)定义函数, 例4-2: 1)首先确定观测数据的范围 在观测到的间隔时间数据中,最小间隔是0.01min,最大间隔是1.96min,观测数值范围为[0.0,2.0]。 2)确定相邻区间宽度为Δb=0.1,b0=0,b20=2.0,构造出20个长度相等的相邻区间。 4)根据上表给出函数h(X)。 5)将连续的区间在横轴上表出,将函数h(x)的数值在纵轴上表出,画出直方图。 要注意选择区间宽度 4.3.2 离散型随机变量分布类型的辨识 (1)点统计法 与连续型随机变量点统计法方法相同,同样是采用计算偏差系数的方法,寻找偏差系数相近的理论分布进行假设。 (2)线图法 线图法是把采集到的数据与假设的理论分布的概率质量函数曲线进行比较。如果找到相近的,则可以假设其为该理论分布。 具体做法步骤如下: ① 设观察数据为:x1,x2,…,xn; ② 将其按递增顺序排列,设共有 m个取值(m≤n),分别为:x(1),x(2),…,x(m); ③ x(i)的数据个数占整个观测数据个数的比例数为hi; ④ 以x(i)作为自变量,以hi的值为函数值,即: hi=f(x(i)),i=1,2,…,m; ⑤ 由函数值 hi向相应的自变量 X(i)做垂线所得的图形称为线图(见下图 ); ⑥ 与假设的理论分布的概率质量函数比较,确定随机变量的分布。 例:观测在.7:00am~7:05am时间段内到达某十字路口西北拐角的车辆数目。每周观测 5天,连续观测 20周,在 5分钟内到达的车辆数目列表 4.5中。 4.4 参数估计 用直方图或线图确定样本数据服从的理论分布之后,还要根据已经观察到的样本计算出理论分布的参数。如果可以确定理论分布的参数,我们就建立了输入参数的一个数学模型,可以用前面(第三章)介绍的方法来生成随机变量的数值。 按照统计学的说法,假设某随机变量的总体分布是F,分布F的参数未知,要用已经观测到的部分样本来计算全部样本总体分布F的参数的真值,这样的统计推断问题被称为估
文档评论(0)