- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1
SAS基础与金融计算
游家兴
厦门大学经济学院计统系
2
上节课上机操作(1)
对上节课生成的最终数据集total进行如下操作:
(1)剔除金融业上市公司;
(2)剔除每股收益为负的上市公司;
(3)由于数据集中年涨跌幅采用百分比表示,建立一个新的变量,采用小数表示。
(4)建立一个新的变量,表示除第一大股东外其它股东所持有的股份比例。
3
(1)剔除金融业上市公司
第一步: 运用substr语句
Data test;
set total;
code=substr(code,1,6);
Run;
4
第二步:
Data temp1;
set test;
if code=000562 or code=000001 or code=000563 or code=600015 or code=600016 or code=600030 or code=600036 or code=600816 or code=600000 or code=601998 or code=601328 or code=601166 or code=601318 or code=601398 or code=601628 then delete;
Run;
5
(2)剔除每股收益为负的上市公司
Data temp2;
set temp1;
if eps0 then delete;
Run;
Data temp2;
set temp1;
if eps=0 ;
Run;
6
(3)建立新变量:用小数表示的涨跌幅
Data temp3;
set temp2;
re2=re/100;
Run;
7
(4)建立新的变量表示其它股东持股比例
Data temp4;
set temp3;
ratio2=1-ratio/100;
Run;
8
本节课上机作业(2)
公共信箱下载数据集test1和test2,运用SAS将test1和test2纵向拼成新的数据test。
根据股票收益率大小将test分成四个组,并形成四个子数据集:tmp1,tmp2,tmp3,tmp4。
在数据集test中,第一大股东持股比例在50%以上且每股收益超过1元的公司有多少家?
9
描述统计分析
常见的数据统计描述量及意义
(1)表示分布平均水平和位置的特征量:
均值:数据的平均值—Mean
众数:观测值中出现最频繁的数值—Mode
中位数:观测值排序中处于中间位置的值—Median
百分位数:中位数的推广—P1、P33、P99
10
(2)表示分布离散程度的特征量
标准差
Std
方差
Var
变异系数
CV
标准误
STDEER
11
(3)表示形状的特征量:偏度和峰度
偏度( Skewness ):
偏度主要用于判断分布形状是否对称:
若g1=0,则对称;
若g10,则分布右偏(正偏);
若g10,则分布左偏(负偏)。
12
峰度(Kurtosis):
峰度是以正态分布为比较标准。对于正态分布,g2=0;
若g20,表示变量分布比正态分布更集中,分布呈尖峰状态,平均数的代表性较好;
若g20,表示变量分布比正态分布更分散,分布呈平坦峰,平均数的代表性较差。
13
SAS中可以对数据进行描述统计分析的过程步有很多,其中两个最常用的过程步是:
(1)MEANS过程(均值过程)
(2)UNIVARIATE过程(单变量过程)
14
MEANS过程用来对数据集中的数值变量计算简单描述统计量。该过程由下列语句控制:
PROC MEANS [options] [statistics-keywords];
VAR variables;
BY variables;
CLASS variables;
OUTPUT [OUT=SAS-data-set] [output-statistics];
Run;
1. MEANS过程
15
(1)PROC MEANS语句
PROC MEANS [options] [statistic-keywords]
[options] :DATA=SAS dat
您可能关注的文档
最近下载
- 浙江省宁波市余姚中学2024-2025学年高二上学期10月月考地理.doc VIP
- 建筑装饰行业数字化转型升级分析报告:2025年现状与未来十年展望.docx
- 拼读小能手(彩色版).pdf VIP
- 国际投资(经管专业)全套教学课件.pptx
- 进化生态学课程-康乐讲授-生态基因组学.pdf VIP
- 标准图集-17J008 挡土墙(重力式、衡重式、悬臂式) 无水印.pdf VIP
- 20220104-兴业证券-高频漫谈.pdf VIP
- 变频器基础知识培训ppt课件完整版.pptx VIP
- 新能源运营商行业深度:新能源全面入市,三大压制因素释放绿电迎反转.pdf VIP
- T CRHA 035—2024 化疗所致周围神经病变的评估技术规范.pdf VIP
文档评论(0)