- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学导论 第一讲:初识统计 中心任务:有效利用数据 Data Collection:实验设计、抽样调查 Descriptive Statistics: summary statistics, graphical methods, smoothing Inferential Statistics: 参数估计、假设检验、回归分析、分类、预测 统计是科学方法(cf. Wiki)的一部分 Define the question Gather information and resources (observe) Form hypothesis Perform experiment and collect data Analyze data Interpret data and draw conclusions that serve as a starting point for new hypothesis Publish the results Retest (frequently done by other scientists) 霍乱的流行病学调查 (Snow, 1855) 关于霍乱(cholera) 致病与流行的根源: Imbalance in the humors (choler) of the body Miasma, or bad air Poison in the ground John Snow (1855)的生物致病学说:致病生物经水、食物到达人体内大量繁殖 ) 病人的排泄物携带致病生物,污染水源和食物 ) 传染给其他人 支持Snow学说的证据 Spread along the tracks of human commerce When a ship entered a port where cholera was prevalent, sailors contracted the disease only when they came into contact with residents of the port 对1848 年伦敦霍乱流行的研究 首位病例John Harnold:刚从流行地区汉堡回来的海员 第二个病例Blenkinsopp: Harnold死后住进了Harnold的房间 两栋邻近的公寓住房: 一个发生严重的传染:饮用水受到污染 一个未发生传染:饮用水比较干净 1854年的大爆发 通过绘制spot map,发现发病地区集中在the Broad Street pump供水区域 此地有些机构传染病例很少,甚至没有: 一个是酒厂,工人喜欢酒甚于水,并且有自己的供水泵 一个是贫民院,也有自己的供水泵 其它地区的受到传染者:多数是因为饮用了the Broad Street pump提供的水 Snow的统计研究 自来水厂的取水河段(Thames河)的污染程度vs 死亡率: 水质越差,死亡率越高 例外:Chelsea水厂,取水区域污染严重,但它有相当现代的净化设施 绝妙的“实验” Lambeth水厂1852年从污染河段移到上游干净河段取水 Southwark Vauxhall仍然留在严重污染河段取水 两个水厂竞争激烈:客户的特征没有明显差异;相邻住户常常使用不同厂家的水 样本量很大 1853-54年的流行病数据 若干统计学名词 Population: 全体London居民 Sample:两个水厂的供应对象 Random sample, sample size Variables:饮用水质(好、坏),传染风险 Hypothesis:坏的水质是高死亡率的原因 Association vs causal relation Experiments vs observational studies 模型:数据的生成机制 随机变量:取值无法预先确知的量 随机变量的刻画:分布、分布函数、分布密度、均值、方差…… 统计模型: 数据:随机变量(多次重复)的观测值 刻画随机变量分布的数学表达式:属于先验知识或假设 本例中的模型 水质X: X=0代表干净水,X=1代表污染水 传染风险Y:Y=0代表不受传染,Y=1代表受到传染 模型:P(Y=1)=a+bX, 其中a,b为非负常数 参数估计问题:求a,b的值 假设检验:原假设b=0 vs 备择假设b0 如何求解:属于统计学的职责,可以采取不同的思路,概率论是必备工具 本例是两组重复Bernoulli实验 Bernoulli实验:投掷硬币(flip coin),实验结果 2 {成功, 失败},成功概率p2[0,1] N次投掷成功n次的概率CnNpn (1-p)N-n 二项分布:n随机变量,N已知数,p参数, 受污染水厂:N0=40046, p0=a+b 未
您可能关注的文档
最近下载
- 数学学科课和数学活动课.docx
- 推台锯操作规程.pdf VIP
- Unit1Music测试卷2024-2025学年沪教版(五四制)七年级英语下册.docx VIP
- DB51∕T 940-2009 草原有害生物防治农药安全使用规范.pdf
- 医疗器械注册质量管理体系核查指南.pdf
- 江苏省南京市第二十九学校2023-2024学年九年级下学期第一次月考英语试题和答案详解.pdf
- 二年级上册语文素材指鹿为马人教部编版.ppt
- 2024年宁夏银川市单招职业倾向性测试题库及答案(全优).docx VIP
- 第五课 为什么我一个人站着吃.pptx VIP
- 17J925-1_压型金属板建筑构造.docx VIP
文档评论(0)