2015汇丰杯Sas数据分析大赛试题.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2015汇丰杯Sas数据分析大赛试题

Sas数据分析大赛试题 [背景介绍] 以下是某公司销售信息,全部数据如下: [题目要求] 1)使用Data步计算两个新变量,dif1是当年销售额和上一年销售额的差值,dif2是当年利润和上一年利润的差值。使用数组与DO循环完成这个操作,分别计算不会得分。只计算东部地区 2)编写宏%report(type= ,var=)完成如下功能: a.type有两个取值,分别是year和market,当type=year时则需要做反映时间序列的图,作线形图,当type=market时,做反映地区比较的图,作条形图,。 b.var有两个取值,分别是sale和profit,以输入的变量为指标作图。 2、PROC SQL过程和转置试题 [背景介绍] 该数据取自银行系统的贷款表和交易流水表,字段说明如下: 贷款表(Loans): 每条记录代表某个账户的上的一条贷款信息,条数:682 贷款表(Loans) 名称 标签 说明 disp_id 权限号 ? loan_id 贷款号 ?(主键) account_id 账户号 ? date 发放贷款日期 amount 贷款金额 ? duration 贷款期限 ? payments 每月归还额 ? status 还款状态 A代表合同终止,没问题;B代表合同终止,贷款没有支付;C代表合同处于执行期,至今正常;D代表合同处于执行期,欠债状态。 交易表 (Trans): 每条记录代表每个账户上的一条交易,条数:1056320 交易表 (Trans) 名称 标签 trans_id 交易序号(主键) account_id 发起交易的账户号 date 交易日期 type 借贷类型 operation 交易类型 amount 金额 balance 账户余额 K_Symbol 交易特征 bank 对方银行 account 对方账户号 两张表的连接关系如下: [题目要求] 根据上文提供的材料,获取每个贷款账号贷款发放前的帐户余额(即贷款前最后一次交易的帐户余额),如果贷款前最后有交易的一天有多笔交易,则取帐户余额的均值。表的效果如下: 使用一条SQL语句得到完全一致的结果和展示效果,需要给变量加标签。 说明: 1)展现的变量分别是loan_id(来自贷款loan表的loan_id),date(来自贷款loan表的date),tran_date(来自交易trans表的date),amount(来自贷款loan表的amount),avg_balance(来自交易trans表的balance); 2)每笔贷款有一条记录,没有贷款则没有记录 3)使用到了Proc SQL步的表的横向连接、汇总函数和非关联子查询。 3、(数据见data3)湖南在历史上是一个灾害多发的地区,由于当地森林资源分布比较丰富,在旱季尤其是冬季是森林火灾的高发季节。而由于森林分布不均、气象条件不同、地形条件不同、经济发展水平差异等各种原因,灾害的发生、控制、预防和消防处理等问题,在各个不同的地区有明显的差异,进行灾害风险控制和防范就需要对各个地区的灾害风险进行分级分区处理。这里提供了湖南省各个地级市2013年森林火灾发生的相关数据,根据此数据,利用聚类分析,对于灾害进行风险分区。需要完成下列工作。 巴斯扩散模型引入三个参量来预测Nt(消费者在第n期购买该产品的数量) :   m=市场潜力, 即潜在使用者总数。 p=创新系数(外部影响), 即尚未使用该产品的人,受到大众传媒或其他外部因素的影响,开始使用该产品的可能性。 q=模仿系数(内部影响), 即尚未使用该产品的人,受到使用者的口碑影响,开始使用该产品的可能性。

文档评论(0)

2017ll + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档