统计分析(R+SPSS)考查考试试卷.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文 华 学 院 2017~20 学年度 第学期 《》试卷(A卷) 课程性质:(修) 使用范围:(科) 考核时间: 年 5 月 25 日 √ 阅卷老师签名 试题:gplot2包),完成以下小题,最后给出分析总结。(65分) shoot数据集中共有398行,13个变量 ID:各案件编号 Title:案件名称 Location:案件发生所在的州 Date:案件发生日期 Summary:对案件的概述,如枪手名字,年龄,事件经过等 Fatalities:该次案件中死亡人数 Injured:该次案件中受伤人数 Total:该次案件中总计伤亡人数 Mental:枪手是否有精神问题 Race:枪手的种族/肤色,有White、Black、Asian等等 Gender:枪手性别 Latitude:纬度 Longitude经度 求出每年受到枪击的死亡人数,并画出条形图;(5分) 使用leaflet包,在地图上标出死亡人数的地理位置分布;(10分) 画出枪手性别分布的条形图。(5分) 画出枪击案的种族分布的玫瑰图;(10分) 画出枪击案的月份分布条形图;(5分) 患有精神疾病的和没有患有精神疾病的人是否是数量的差异,画出箱线图;(10分) 画出枪手的年龄分布条形图;(5分) 画出枪击案件的城市分布和州分布图;(10分) 分析总结枪击案。(5分) 试题二: 用包party里面的函数ctree()为数据集iris建立一个决策树,在建立模型之前,R基础包自带的iris(鸢尾花)数据集被分为两个子集:训练集(70%)和测试集(30%)。使用随机种子设置固定的随机数,并画出决策树。(15分) 试题三:以R基础包自带的鸢尾花(Iris)数据进行聚类分析0分) 要求: 2. 编写的程序正确(能编译,链接,执行)。 3. 程序有输出结果截图。 试题一: 现有一个美国枪击案的数据集, 记录的是从1966~2017年发生在美国的大规模枪击案(死伤人数在三人以上的枪击案),对该数据集进行分析以及可视化(使用ggplot2包),完成以下小题,最后给出分析总结。(65分) 求出每年受到枪击的死亡人数,并画出条形图;(5分) 使用leaflet包,在地图上标出死亡人数的地理位置分布;(10分) 从地理信息结合人口信息来看,美国东部发生枪击案的概率要高于美国西部 画出枪手性别分布的条形图。(5分) 男性作案的可能性远远大于女性 画出枪击案的种族分布的玫瑰图;(10分) 白人作案很多,但是黑人作案的数量也在上升 在枪手中,白人以及黑人占绝大多数,而亚裔枪手则只占极小部分 画出枪击案的月份分布条形图;(5分) 10月份发生枪击案的数量最高,最危险 患有精神疾病的和没有患有精神疾病的人是否是数量的差异,画出箱线图;(10分) 这些被杀死的受害者中,明显被有精神问题杀害的人居多 画出枪手的年龄分布条形图;(5分) 从年龄分布上来看,年轻人作案的几率较大 画出枪击案件的城市分布和州分布图;(10分) 城市分布: 州分布: 发生枪击案件最多的是加州 分析总结枪击案。(5分) 1.从枪手的性别来看,男性作案是极大多数 2.从枪手的种族来看,白人是作案的主体,但是黑人作案的数量也在逐年上升 3.从枪手的年龄分布来看10~50岁之间的青中年占了绝大多数 4.从枪手的精神疾病来看,虽然枪手患有精神疾病和没有患有精神疾病的数量并不显 著,但是患有精神疾病的枪手会造成更大的伤害,一定要重点控制 5.从枪击案件的时间上来看,枪支犯罪在2015年上升的最多,但是到了2017年有了一个极端的上升,可见控枪的重要性 6.从枪支案件的地理信息来看,总体上东部发生枪击案件的数量要大于西部 7.从枪击案发生的数量上来看,加州这几年发生枪击案的数量最多 试题二: 用包party里面的函数ctree()为数据集iris建立一个决策树,在建立模型之前,R基础包自带的iris(鸢尾花)数据集被分为两个子集:训练集(70%)和测试集(30%)。使用随机种子设置固定的随机数,并画出决策树。(15分) 决策树图:每一个叶子节点的条形图,显示了一个实例被划分到某个种类的概率 简化决策树:图中表现为叶子节点中的“y”,节点5中的标记“n=21,y=(0,1,0)”,表明该节点包含21个训练实例,并且所有实例都属于“setosa”这一种类。 测试决策树 使用测试数据对构建好的决策树进行测试。 testPred - predict(iris_ctree, newdata = testData) table(testPred, testData$Species) 决策树算法存在的问题:ctree目前版本不能很好地处理缺失值,因此含有缺失值的实

文档评论(0)

js1180 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档