- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简体PPT
* Elizabeth Newton 博士 幻灯片由Elizabeth Newton(麻省理工学院)准备,其中部分由Roy Welsch(麻省理工学院)与Gordon Kaufman(麻省理工学院) 1 2 15.075,应用统计学 讲课:M,W 10-11:30 复习课:R 4-5 教材:《统计学与数据分析》Tamhaneand Dunlop着 编程:S-Plus 考试:期中(课内)和期末 先修课程:微积分,机率论,线性代数, 3 15.075,应用统计学,课程大纲 ?收集数据 ?概括和探索数据 ?机率论复习 ?统计量的抽样分布 ?推断 点估计与区间估计,假设检验 ?线性回归 ?变量分析 ?非参数方法 ?专题(数据挖掘?) 4 统计学 是为了得出结论和决策而进行的数据采集及数据分析之科学。 Tamhane,AjitC.,Dorothy D,Dunlop,《统计学与数据分析进阶》。Prentice Hall,2000,第1页, 「统计学决不能取代判断」, Henry Clay。 5 「米」如何定义? 四分之一子午线(从极点到赤道)的一千万分之一。 但是--它不精确. 为什么? 6 《对所有事物的测量》,Ken Alder, 描述两个法兰西天文学家,Delambre and Mechain,企图确定法兰西大革命时期地球的周长。 用三角测量法确定巴塞隆那与敦刻尔克之间的距离,需要知道每一个端点的纬度 (透过测量天体高度)。 7个月到7年。 Mechain获得相矛盾的讯息 ,隐瞒了数据的部分讯息。 7 页214(《所有事物的测量》): 「什么被记为误差?谁能断言你将要犯错误? 如何近似为充分近似?Mechain和他的同事 都没有能够以相当程度的信心回答上述问题。 他们对统计简直是一无所知。」 - 引自 Alder,Ken。《测量所有事物》之〈7年奥德赛及隐藏误差改变世界〉,Free Press,2003。 8 数据:一组测量值 特性: 名义的,如颜色:红,绿,蓝 二元的,如(M,F),(H,T),(0,1) 序数的,如对待战争态度:支持,中立,不支持 数字的 离散的,如儿童数量 连续的,如距离,时间,温度 也包括: 间隔,如华氏温度 比率(绝对零),如距离,儿童数量 9 S-Plus数据集:cu.摘要 10 概念 数据集常写成矩阵形式,行对应观测值,列对应变量。 总体: 所有感兴趣的单元的集合(有限或无限). 例如:麻省理工学院的所有学生 样本: 实际观察总体的一个子集. 例如:在这教室里的学生. 变量: 每一单元的性质或属性,例如 年龄,高度 观察值: 独立单元的所有变量的值 11 概念(接上) 参数: 针对每一变量定义的总体的数字特性,如反对战争人数的比例。 统计量: 用于估计总体参数的样本数字函数。 精确度: 参数估计量的散布 准确度: 与偏差对应的估计量与真值的近似程度 偏倚度: 估计量与真值的系统偏离程度 12 准确度和精确度 正确且精准 正确但精准 精准但不正确 不正确且不精准 由麻省理工学院开放式课程提供 13 研究设计与执行步骤 背景研究和文献综述。 定义研究目的及具体假设。 确定要测量的变量及如何测量。 制定收集数据的计划内 抽样设计 样本大小 包括的范围 人员训练 汇集数据 分析数据 结果报告 14 伦理观 从人类角度: 从动物角度: (见 H u lley C u m m i n gs之《临床研究设计》) 15 统计研究 描述性的: 一组,例如调查,选举 比较性的: 2 组以上,例如对不同教学方法效果的比较。 实验性的: 调查人员主动介入以控制研究条件 寻找预测值(解释变量)与响应(输出值)之间的关系 明确因果关系,例如药物试验 观察性的: 调查人员透过旁观记录数据 难以区分预测值干扰变量(潜变量)件间的影响。 建立联系,例如Framingham之《心脏研究》 16 观察性研究: 横截面研究 寻找某一时点的样本 例如人口普查,样本调查 预测研究(昂贵!) 对样本(一群)进行时间序列跟踪研究 。 例如Framingham之心脏研究,护士健康研究 回顾研究(案例控制) 按时间追溯 17 观察研究中的误差来源 抽样误差 样本不同于总体 测量偏差 界定问题不清晰 自我选择偏差 拒绝参与 回应偏差 不正确或不真实的回应 18 抽样类型 机率抽样(总体中的任一单元都具有非零机率) 简单随机抽样 (SRS) 分层随机抽样 多阶段分群随机抽样 系统抽样 非机率抽样 (估计可能有偏差,但 经常是唯一可行抽样方法) 便利抽样,例如超市调查 判断抽样由调查员确定 19 简单随机样本 (SRS) 总体 从大小为N的
您可能关注的文档
- 第十一章系统的状态变量分析法.ppt
- 附录MATLAB简介.ppt
- 主要成就---非合作博弈.ppt
- 使用者網路行為分析理論-ShareTech.ppt
- Spice模型概述.ppt.ppt
- 量体温-HealthInformationTranslations.PDF
- 第2章設計簡單的程式.PDF
- SPSS系统教程.ppt
- 安裝和使用手冊-MorningstarCorporation.PDF
- 奔驰W220仪表板(ICM)相关匹配操作.PDF
- 辉瑞生物制药研发管线研发管线产品管线优化建议报告.docx
- 元宇宙虚拟会展行业技术创新与应用前景2025年分析报告.docx
- 跨境电商运动服饰智能分拣技术升级对行业竞争力影响.docx
- 2025年金融行业长尾词欺诈交易风险控制与优化报告.docx
- 2025年运动医学市场增长潜力与运动医学领域投融资分析报告.docx
- 元宇宙虚拟偶像与粉丝经济融合创新模式与市场前景分析.docx
- 2025年AI芯片在智能机器人视觉识别领域的应用与发展研究报告.docx
- 元宇宙虚拟偶像与粉丝经济互动模式研究报告:市场前景与运营模式.docx
- 辉瑞-BioNTech疫苗研发合作,2025年疫苗市场潜力与投资策略.docx
- 元宇宙虚拟会展行业市场细分与竞争格局2025年分析.docx
最近下载
- VEICHI伟创 AC310系列变频调速器使用手册2021.06.pdf VIP
- 隧道施工课件.ppt VIP
- 第五届国家级新区经开区高新区班组长管理技能大赛备赛试题库-下(判断题汇总).docx VIP
- DB 6108T 53-2023 煤基固废调理剂修复沙化土地技术规范.docx VIP
- DB6108_T 52-2023 煤基固废调理剂修复盐碱地技术规范.docx VIP
- 行政人事部年终工作总结.pdf VIP
- 行政人事部年终工作总结.pptx VIP
- 第五届国家级新区经开区高新区班组长管理技能大赛备赛试题库-中(多选题汇总).docx VIP
- 化工厂物资明细表.xls VIP
- 第五届国家级新区经开区高新区班组长管理技能大赛试题库(浓缩500题).docx VIP
文档评论(0)