CPDA考试应用模拟[参考].pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、 计算题(题数: 4,共 分) 1. 影响中国人口自然增长率的因素有很多,据分析主要因素可能有: (1)从宏观 经济上看,经济整体增长是人口自然增长的基本源泉; (2 )居民消费水平,它的 高低可能会间接影响人口增长率。 (3) 文化程度,由于 教育年限的高低, 相应会转变人的传统观念, 可能会间接影响人口自然增长率 (4 ) 人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。为了全面 反映中国“人口自然增长率”的全貌,选择人口增长率 作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均 GDP”作为 经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代 表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表 1): 设定的线性回归模型为: 算法 1 多元线性回归 .xlsx (1)求出模型中的各个参数,试从多个角度评价此线性回归模型,并检验模型的 经济意义; (2)检验模型中是否存在多重共线性问题(逐步回归) ,若有,试消除多重共线 性。 答案解析: (1)直接进行线性回归即可得到各个参数 (用excel )。多元线性回归模型评价可 以从拟合优度、 T 检验、 F 检验等多个方面出发。 (2)求变量的相关系数矩阵或采用逐步回归法(也可以用 datahoop 平台做线性 回归,会自动删除共线的变量) 。 2. 对近期上映的 10 部电影进行调查研究,抽取 290 人对这 10 部电影的评分(分 值 0~10 分),结果如下表所示。 (1)根据表中数据对这 10 部电影的评分进行因子分析, 并解析各个因子的含义; (2)可否利用电影的评分数据对这 290 名观影者进行聚类分析给出你的理由。 算法 2 因子分析 .xlsx 答案解析: (1)因子分析选择隐含因子数为 3 ,分别代表动作片、爱情片、动画片的影响评 分因子。 (2)可以,这 290 人对电影的偏好有区别,可以进行聚类,相关性分析后排除共 线性的影响再进行聚类。 3. 某超市为了优化商品摆放结构,对近期顾客购买的商品类型进行了统计,如附 表所示。 (1)写出所有有效强关联规则( minsupport=10% ,minconfidence=50% ); (2)结合实际情况分析顾客喜欢的商品搭配,并对该超市提出合理的建议。 算法 3 关联分析 .xlsx 答案解析: 关联规则分析中设置参数( minsupport=10% ,minconfidence=50% ),结果中强关 联规则通过调整显示条目全部写出(重复的删除) 。结合实际情况分析要写详细。 4. 某市为调查驾驶员视力情况(“ 1”表示视力正常,“ 0”表示有视力缺陷) 、年 龄、是否有驾驶教育经历(“ 1”表示有,“ 0”表示没有) ,这三个因素对是否曾 引起交通事故(“ 1”表示发生过,“ 0”表示未发生过)的影响 ,随机抽样调查了 45 名驾驶员,得到数据如下: (1)建立模型分析驾驶员视力情况、年龄、是否有驾驶教育经历对是否曾引起交 通事故的影响,写出详细的思路过程。 (2)若要应用此模型预测某批驾驶员中可能会引起过交通事故的人都有哪些,则 还需要进行的研究步骤有哪些请说明。 算法 4 逻辑回归 .xlsx 答案解析: 逻辑回归,数据预处理包括分析共线性和异常值等,数据分为训练数据和测试数 据,综合训练误差和测试误差评价模型。第二问要收集数据、处理数据

文档评论(0)

飞翔的燕子 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档