- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基本概念介绍 吴喜之 随机性和规律性 有许多定律,例如牛顿三定律,物质不灭定律,爱因斯坦相对论等等。 但是在许多领域,很难用如此确定的公式或论述来描述一些现象。比如,人的寿命。一个吸烟、喝酒、不锻炼、而且一口长荤的人可能比一个很少得病、生活习惯良好的人活得长。 可以说,活得长短是有一定随机性的(randomness)。这种随机性可能和人的经历、基因、习惯等无数说不清的因素都有关系。 随机性和规律性 从总体来说,我国公民的预期寿命却是非常稳定的。而且女性的预期寿命也稳定地比男性高几年。这就是规律性。 你可能活过这个寿命,也可能活不到这个年龄,这是随机的。 但是总体来说,预期寿命的稳定性,却说明了随机之中有规律性。这种规律就是统计规律。 概率和机会 常听到概率这个名词。如天气预报中提到的降水概率。如果降水概率是百分之九十,那就很可能下雨;但如果是百分之十,就不大可能下雨。 因此,从某种意义说来,概率描述了某件事情发生的机会。 显然,这种概率不可能超过百分之百,也不可能少于百分之零。换言之,概率是在0和1之间的一个数,说明某事件发生的机会有多大。 有些概率是无法精确推断的 比如你对别人说你下一个周末去公园的概率是百分之八十。但你无法精确说出为什么是百分之八十而不是百分之八十四或百分之七十八。 其实你想说的是你很可能去,但又没有完全肯定。 实际上,到了周末,你或者去,或者不去;不可能有分身术把百分之八十的你放到公园,而其余的放在别处。 有些概率是可以估计的 如掷骰子。只要没有人做手脚,你得到任何点的概率都应该是六分之一。 这反映了掷骰子的规律性。 但掷出骰子之后所得到的结果还只可能是六个数目之一。 这体现了随机性。 如果你掷1000次骰子,那么,大约有六分之一的可能会得到6;这也说明随机结果也具有规律;而且有可能通过试验等方法来推测其规律。 我们就是要通过对世界的观测数据,在随机性中寻找用概率和数学模型描述的规律性 总体:我们感兴趣的那部分现实世界 总体通常用变量来代表 变量可以是一维或多维的 变量可以是定性或者定量的 定性变量由随机(数量)变量描绘 随机变量有分布(总体分布) 而分布又由(总体)参数来区别 总体和变量永远也不可能全部认识 只有通过样本才能够明白 总体通常用变量来代表 一个调查问卷可能有关于性别、年龄、收入、观点、教育程度、财产情况、纳税情况、职业等问题。 这些:性别、年龄、收入、观点、教育程度、财产情况、纳税情况、职业等,都是变量 变量可以是一维或多维的 年龄,收入等都是一维的 而地理坐标就是二维的 许多变量的组合,则可能是多维的。 变量可以是定性或者定量的 性别、观点、教育程度、职业等变量是定性的。 年龄、收入、财产情况、纳税情况等变量可以是定量的 定性变量也要由随机(数量)变量描绘 性别、观点、教育程度、职业等变量是定性的,无法用数量直接描述 但是,它们的频数、比例等可以用数量描述 没有用数量描述的量,无法参加数据分析过程 随机变量有分布(总体分布) 有离散性分布(如二项分布、Poisson分布、超几何分布) 也有连续性分布(如正态分布、t分布,c2分布,F分布) 离散分布 随机回答选答题可能得到的分数 例: 纯粹随机回答三个单选题(每个5种选择)可能答对0、1、2、3题的概率为 可用表或公式描述分布(想想为什么) 它相当于从一个装有1个红色球和4个蓝色球(总数5个)的罐子,每次随机取出一个,观察其颜色;再放回;再接着取下一个(放回抽样)。一直取3次(回答3个问题) 一次抽取得到红色(答对)的概率为 p=1/5, 而得到蓝色的概率为q=1-p=4/5. 均观测不到红球(答对0题)的概率为p(0)=P(BBB)=P(B)P(B)P(B)=(4/5) (4/5) (4/5)=(4/5)3= q3= 0.512 只观测到1次红球(恰答对1题)的概率为p(1)=P(RBB)+P(BRB)+P(BBR)=(1/5) (4/5) (4/5)+(4/5)(1/5)(4/5)+(4/5) (4/5)(1/5)=3(1/5)(4/5)2=3pq2= 0.384. 只观测到2次红球(恰答对2题)的概率为p(2)=P(RRB)+P(RBR)+P(BRR)=(1/5)(1/5)(4/5)+(1/5)(4/5)(1/5)+(4/5)(1/5)(1/5)=3(1/5) 2(4/5)= 3p2q= 0.096. 三次抽取,均为红球的概率为p(3)=P(RRR) =(1/5)(1/5)(1/5)=(1/5)3=p3=0.008. 二项随机变量 n 次同等条件的独立试验 每次试验仅有两种结果,通常记为S (成功) 和 F (失败). 成功(S)的概率在每次试验保持不变,用p表示, 失败 (F)概率则为 q=1-p. n 次试验中成功的数
文档评论(0)