1数据分析报吿.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
矩形框包括了数据集中位于中间位置的50%的数据。从矩形框两端向外延伸的两条直线为触须线,“箱”两端的“须”一般为最大值与最小值,如果资料两端值变化较大,两端也可采用P99.5与P0.5、P99与P1或P97.5与P2.5。 在两条触须线顶端画出两条横线被称为奇异值截止线,上截止线与下截止线之间的范围为该组数据正常值的分布区间,落在此区间以外的数据可以认为是奇异值。 对大于第三分位数与第一分位数之差的1.5倍的奇异值或小于第三分位数与第一分位数之差的1.5倍的奇异值,SPSS制图软件用“0”标出;对大于第三分位数与第一分位数之差的3倍的奇异值或小于第三分位数与第一分位数之差的3倍的奇异值,SPSS制图软件用“*”标出。 例:某研究者分别采用安慰剂、新药10mg、新药20mg 治疗三个随机分组的阻塞性肺病病人,每组100 例,治疗两周后测量最大呼气量(forced expiratory volume, FEV)。每组测量后计算获得的P100、P75、P50、P25、P0(即最大值、75%百分位数、中位数、25%百分位数、最小值**)(见下图),试绘制箱线图。绘制箱线图需要借助于股价图中的“开盘-盘高-盘低-收盘图”,该图形需要将数据按一定的顺序排列。因此绘制箱线图时也需要将数据按P25、P100、P0、P50、P75的顺序排列(P25与P75的顺序可对调)。 具体绘制步骤如下: ①选取单元格区域A1:D5,单击“图表向导”图标,在弹出的“图表类型”对话框中选中股价图的“开盘-盘高-盘低-收盘图”(第2 个子图表类型),按下一步键。 ②在图表数据源对话框的数据区域中将“系列产生在”修改为“行”,按下一步键。 ③在“图表选项”对话框的分类(X)轴下方填入“治疗组”,在数值(Y)轴下方填入“最大呼气量(FEV)”,按完成键。 ④在绘图区点击右键,选取“数据源→系列→添加”,在“名称”右侧用鼠标选取单元格A6,在“值”右侧用鼠标选取单元格区域B6:D6 按确定键。 ⑤在网格线上点击右键,“清除”网格线;在绘图区单击右键“清除”背景色。 ⑥在横坐标上单击右键,选取“坐标轴格式→图案”,右上部主要刻度线类型复选“无”,按确定键。 ⑦在纵坐标上单击右键,选取“坐标轴格式→数字→数值”,小数位数改为“0”,按确定键。 ⑧在箱的中心位置P50 系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取“+”,前景颜色处选黑色,“大小”改为6 磅,按确定键;在箱线图的顶部P100系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6 磅,按确定键;在箱线图的底部P0系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6 磅,按确定键。 ⑨适当调整绘图区的大小,调整整个图表区域的字体大小,去除图表区的边框等,可获得上图右侧的箱线图。 2.茎叶图(Stem-and-Leaf plots) 在直方图和盒形图中,很难恢复数据的原貌。而另一种图:茎叶图(stem-and-leaf plots)可以恢复数据的原貌。 茎叶图是一种通过将原始数据画成叶子形状,来同时显示数据的排序以及数据分布特征的图形。 用SPSS软件绘制时,图形主要由频数、茎干、叶子三个部分组成。图形中的茎干部分由原始数据的前若干个数字组成,叶子部分由原始数据的后若干个数字组成。 以地区1高三男生身高为例 其中茎的单位为10cm,而叶子单位为1cm。比如,由于第一行茎为150cm,因此叶子中的九个数字001223344代表九个数目150、150、151、152、152、153、153、154、154cm等。每行左边有一个频数(比如第一行有9个数目,第二行有17个等等);可以看出最长的一行为从165cm到169cm的一段(有35个数)。 统计数据经过整理后,通过统计表或统计图基本上可以看出我们所研究现象的总体数量特征,这些数量特征有总体总量特征、相对特征及次数分布特征,而次数分布既有集中趋势,又有离中趋势。分布的图形有高有低,有偏有正。如何通过具体的数量指标把总体的这些特征加以概括? 模型的含义 模型是相对与原型的,是对原型的抽象。 数量模型:数量关系 考倒中国人 赵本山:请听题:你知道南海属于哪个国家吗? 周立波:中国。 赵本山:恭喜你,答对了!请听题:南海有多少岛礁? 周立波:这个这个。。。说实话不是很清楚。 赵本山:没关系,我告诉你:500个。请听题:500个岛礁受中国控制的有多少?提醒下:使劲的想象! 周立波:??根据我对咱政府的了解,肯定不是全部,但也该有大半? 赵本山:错!4个!没关系,你的想象力还不够大。请

文档评论(0)

三沙市的姑娘 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档