常用统计方法及关键词.docx

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据结构. 变量(指标、特征、属性、字段■样本(观测.记录,实验) 变量取值类型:字符,数值、时间等 3、变量测量类型:名义(定性\有序(定性)1度量(定量) 数据预处理: 1、数据编码及转换; 2、缺失值填补、异常值处理; 3、数据去■纲:标准化、规范化 4、数据概化 描述统计:(表格、图形)(认识、熟悉数据基本情况) 性别.班级、满意度比例分布 值及2、数学.语文、英语、身高、体重.学习时间均值、方差、最值及 值及 分布情况; 3、分性别、班级的成绩、学习时间、身高、体重、满意度的分布情 况; 关键词:频数,频率,累积频数,累积频率、众数; 均值、方差、标准差、中位队分位数、四分位数、皿极差、变 异系数、偏度、峰度、分布函数、密度函数、置信度、置信区间; 列联表、行百分比、列百分比; 熵、基尼系数、异常值; 饼图,柱状图.条形图,折线图、箱图,直方图、面积图、散点图, 茎叶图、Q-Q 假设检验:(利用数据对命题■猜想、假设进行验证) 1、成绩、学习时间,身高、体重在不同性别间是否有差别(有显著 性差异); 2、英语成绩与语文成绩是否有差别(有显著性差异) 满意度在不同性别、班级间是否有差别(显著性差异); 关键词:原假设■备择假设■检验统计量.显著性水平,拒绝域■接 受域、第一类错误概率、第二类错误概率; 参数检验.非参数检验; 单侧检验、双侧检验,独立性检验.显著性检验; 单正态总体检验.两正态总体检验.多正态总体检验、配对检验; 卡方检验、t检验,F检验,似然比检验,自由度、显著性(p-value. sig) 方差分析:(取值三个水平及以上的一个或多个定性变■对某个定量 变量是否有影响) 1,成氮 学习时间,身高.体重在不同班级间是否有差别(有显著 性差异); 2.成绩、学习时间,身高.体重在不同性别,班级间是否有差别(有 显著性差异); 关键词:单因素方差分析,多因素方差分析,总误差平方和.组间误 差平方和■组内误差平方和、自由度、F底方差分析表■显著酝 著性(p-value. sig); 因子、水平、主效应.交互效血全因子模虱二阶效应■高阶效应 相关分析:(变量与变量之间的相互关系) 1,数学.语文,英语,身高、体重.学习时间之间相关性如何; 2,满意度与性别间相关性如何; 关键词:Pearson相关系数.正相关■负相关■不相关,相关性检 验; 列联表.交叉表.卡方统计量、卡方检验.相依系数,Kendall tau 相关系数、Kappa 系数.^比 普通回归分析(多个定量自变量对一个定量因变量的具体数量影响) 1,:身高与体重间的定量关系; 2,数学.语文.英语成绩分别与学习时间之间的定量关系; 关键词:自变量,因变量,解释变量、响应变量、内生变量、外生变 量; 线性函数.回归系数,系数矩阵■设计矩阵,随机误差■高斯■马尔 可夫假设,独立假设,同方差假设.正态假设.散点图; 最小二乘估计,极大似然估计,截距,回归系数估计,回归系数置信 :间估计; 系数显著性检验■模型显著性检验.拟合优度、可决系数调整的可 决系数.RM,回归平方和; 点预测,区间预测; 归诊断.残差标准化残差■学生化残差、删失残差、残差图残 差平方和.异常点.高杠杆点、Cook统计量、多重共线,异方差、 自相关; 变量选择,逐步回归、前进法.后退法.AIC、BIC.^回归,主成 分回归,加权最小二乘回归 T般线性模型:(多个定量和定性自变量对一个定量因变量的影响) 1、身高与体重、性别间的定■关系; 2,数学,语文、英语成绩分别与学习时间、性别、班级之间的定量 关系; 关键词:方差分析、回归分析,因变量、固定因子、随机因子,协变 量、主效应、交互效应、多重比较 广义线性模型:(多个定量或定性自变量对一个定性因变量的影响) 1,满意度与学习时间间的定■关系; 2,是否能通过选拔与性别、学习成绩、身高、体重等间的定■关系; 关键词:二元Logistic回归,多项Logistic回归、Probit回归,对 数线性回归 主成分.因子分析(降维):(将多个定量的变量精简为少数几个定量 新变量) 1,利用学习成绩.学习时间,身高、体重对样本进行综合评价 关键词:协方差阵,相关系数矩阵、特征值、特征向量.贡献率、累 积贡献率、主成分系数,主成分得分;KMO值、Bartlett球形检验. 因子载荷、共同度、因子旋转,因子得分 聚类分析(无监督学习):(根据样本特征对样本进行分类) 1.综合成绩、学习时间、身高、体重对样本进行分类; 关键词:距离、相似系数.夹角余弦,距离矩阵、相似系数矩阵,变 量聚类■样品聚类; 系统聚类.动态聚类,模糊聚类、有序样品聚类、子空间聚类; 最长距离法、最短距离法、重心法、类平均法、可变类平均法、Ward 聚类法.谱系图,K-means

文档评论(0)

dajiefude2 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档