- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                会计研究与统计名软件应用3
                    廖冠民  博士/副教授 中央财经大学会计学院  Thanks 第三讲  数据管理 字符变量的处理 字符变量转换为数值变量 数值变量转换为字符变量 字符变量的分解 重要的字符处理函数  字符变量转换为数值变量1 从文本文档中读入的数值变量可能以字符变量的方式存储 变量中可能包含了特殊符号,如金额`$‘、逗号`,’、斜线`/‘、百分比`%’、破折号`-‘等 字符变量转换为数值变量2 数值观测偶尔误存为字符观测: destring 例:destring  year  date  size  lev,  replace  ignore(-/,%“) 例:destring   code,   gen(code2)  ignore(“-/,%“) 字符变量转换为数值变量3 如果没有特殊符号:real( ) 例:gen code2=real(code) 字符变量转换为数值变量4 数值观测全部存为字符观测:encode 例:encode  code, gen(code2) 该命令自动产生“数字-文字对应表”,命令labelbook查看  数值变量转换为字符变量1 命令:tostring 例: tostring   year  month  day, replace 例:tostring   year, gen(year2) 数值变量转换为字符变量2 函数:string( ) 例:gen year2=string(year) 字符变量的分解与合成 分解命令:split    xxx, parse (x) 例:split  date, parse(-) 合成:+ 例:gen  a=b+c 例:di   “I am” +  “a teacher” 重要的字符处理函数 求助:help function 最重要:substr ( ) 例:gen year=substr(date,1,4) 注意:每个英文字母占一位,但每个中文字符占两位 字符匹配函数:strmatch( ) 例:gen  a= strmatch(ind, “C” ) 变量创建的技巧 _n与_N 虚拟变量的产生  交互项的产生 egen命令 _n与_N _n:样本序号变量,是一个变量,内容为1,2,3,...,n _N:样本数指标,是一个单值,内容为样本数 _n是一个永远存在,但却不能	list出来的特殊变量 _n的取值会随样本排序的变化而变化  产生滞后项:gen   lagsales=sales[ _n-1] 产生前导项:gen   lagsales=sales[ _n+1] 产生最后一项:gen  msales=sales[ _N] 差分:gen  dsales=sales-sales[ _n-1] 增长率:gen  gsales= (sales-sales[ _n-1])/sales[ _n-1] 表示是否为第一/最后一项:if   _n==1   /   if   _N==1 时间序列/面板数据的滞后项、差分、增长率 tsset  code  year gen  lagsales=l.sales gen dsales=d.sales gen gsales=d.sales/l.sales 其他:f.sales     l2.sales     f2.sales    d2.sales 分组进行: bysort  ind: gen a=_n bysort  ind: keep if _n==1 bysort  ind: keep if _N==1  虚拟变量的产生 使用-generate-和-replace-产生虚拟变量 gen hsize=1 if  size1000000  size.     replace hsize=0  if size=1000000 基于类别变量生成虚拟变量 tab  race, gen(dum_ ) xi    i.race     xi    i.race, prefix(dum_ )      xi	   i.race,  prefix(dum_ )	noomit 因子变量 默认对照组:reg   wage   i.race 设置对照组:reg   wage   ib3.race 等分样本:group( num) 例:gen   g_inc=group(5) 条件函数:cond(s, a, b, c) 例:gen  x=cond(age50, 1, 0, .)												 交互项的产生 基本方法:generate 例:gen   jh=state*size 因子变量的应用:i.    c.    #     ##     ( help   fvvarlist ) reg   roa   state    lev    size    r
                 原创力文档
原创力文档 
                        

文档评论(0)