- 76
- 0
- 约1.28万字
- 约 54页
- 2018-03-10 发布于天津
- 举报
统计数据的预处理
第三章统计数据的预处理
① 异常数据
② 缺失数据
数据预处理
把混在原始数据中的“异常数据”排除、把真
正有用的“信息”提取出来,有助于推断统计
得出正确分析结论。
1 :异常数据取舍
2 :未检出值和/或缺失值估算
采用异常数据进行推断统计得到的结论误
导带给科研与统计控制判断出错的隐患不
可小视。
一、异常数据
单个异常值:是指单个样本观测数据组内
隐含的个别异常数据。同义词有:可疑值、
异常值、极端值、端值、离群值、逸出值、
奇异值、超限值、粗值…
异常均数:三个以上(k≥3 )样本多均数
要作统计分析比较时,无疑也要检查其中
是否隐含可疑均数。
研究者对7例糖尿病患者给某种药物后,
测量其血中胰岛素(/ml,X1)和血糖
(mg%,X2)
患者编号 1 2 3 4 5 6 7
胰岛素(X1 ) 24 17 18 12 15 121 10
血糖(X2 ) 142 170 194 213 214 238 249
作者采用直线相关分析
0.3140,γP 0.05
结论:血液中胰岛素与血糖两者含量之间
无直线相关
Correlations
胰岛素x1 血糖x2
胰岛 Pearson Correlation 1 .314
素x1 Sig. (2-tailed) .493
N 7 7
血 Pearson Correlation .314 1
糖x2 Sig. (2-tailed) .493
N 7 7
剔出第6对数据 Correlations
前后的Pearson 胰岛素xa 血糖xb
相关系数,前 胰岛 Pearson Correlation 1 -.936**
素xa Sig. (2-tailed) .006
者是0.314,后 N 6 6
者是-0.936, 血 Pearson Correlation -.936** 1
糖xb Sig. (2-tailed) .006
显示有相关 N 6 6
性! **. Correlation is significant at the 0.01 level
(2 il d)
您可能关注的文档
- 深圳福田中心区CBD规划建设经验教训及规划评价Shenzhen.PDF
- 深度学习在携程攻略社区的应用-李健-携程技术中心.PDF
- 混合云存储中海洋大数据迁移算法的研究-计算机研究与发展.PDF
- 清华大学2016年毕业生就业质量报告-清华大学学生职业发展指导中心.PDF
- 温德青室内乐泼墨Ⅰ的音响观念及其结构途径-WenDeqing.PDF
- 温度和振动对光纤马赫曾德干涉仪的影响与动态补偿-电子科学技术.PDF
- 港人内地读书就业身份待遇问题研究十大政策-一国两制青年论坛.PDF
- 湖北经济学院会计硕士专业学位MPAcc研究生培养方案-金融学院.PDF
- 湖南沅水五强溪水电站扩机工程公众参与说明书-五凌电力有限公司.PDF
- 漕河泾某大厦房屋完损状况检测评定报告-房屋鉴定.PDF
最近下载
- 上海大学2022-2023学年第1学期《高等数学(上)》期末考试试卷(A卷)附参考答案.pdf
- 中国教育行业人才流动与薪酬水平_2025年12月.docx
- 2024全国初中数学联赛初二卷 .pdf VIP
- 全国初中数学联合竞赛真题及答案(初二组)2015-年.pdf VIP
- AIAG-VDA-SPC手册-Yellow-Volume2026年2月第一版 中文.pdf VIP
- 美甲美睫投资回报2026年培训课件.pptx VIP
- 中国王氏家谱字辈大全.doc VIP
- 《Michael_Porter_Creating_Shared_Value》.pdf VIP
- 直播带货虚假宣传法律规制研究.pdf
- 新大洲本田MS01说明书用户手册.pdf
原创力文档

文档评论(0)