- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二讲stata画图和线平性回归基础
Stata 画图和回归基础 Stata作图 stata 提供各种曲线类型,包括点(scatter)、线(line)、面(area),直方图(histogram)、 条形图(bar)、饼图(pie)、函数曲线(function)以及矩阵图(matrix)等。 同时,对时间序列数据有以ts 开头的一系列特殊命令,如tsline。还有一类是对双变量的回归拟合图(lfit、qfit 、lowess)等。 作图时命令方式比较复杂,建议多用菜单方式。 一起来做下列图形: 简单图形 打开wage1.dta 1。 男性和女性工资均值的条形图 2。 白人和其他人的工资的饼状图 3。 wage的直方图,并检验是否服从正态分布。 4。 wage的核密度分布图。 组合图形 画出price与weight的散点图,并画出其拟合线。 图形界面设计: 图形标题,X轴标志,Y轴标志,样式选择,图例,分组标志。 两个练习: 1。完成下列汽车拟合图。 2。查阅数据,并按照要求完成图形。 2、中国的GDP(以购买力平价计)何时能超过美国?从Penn World Table(最权威的跨国宏观数据集)下载两国1978-2010年“Population”与“Real GDP per capita” 数据,导入Stata中,将两国log(GDP)的时间趋势画在一张图上,并做简单外推预测(假设未来的增长率与1978-2010年间相同)。下载地址为: /php_site/pwt_index.php。下载时选csv格式,按网站说明存储数据。 小样本OLS 我们得到: 习惯上我们用 y_hat = X*b (被解释变量的拟合值) e = Y - y_hat = Y - Xb ( 残差 ) 建立回归方程 打开系统文件auto,建立如下方程: regress命令详解: regress depvar [indepvars] [if] [in] [weight] [, options] sysuse auto,clear regress price mpg weight foreign 1。要求方程省略常数项 2。稳健性估计(一般用于大样本OLS) 3。重新设置置信区间(默认95%) 4。标准化系数(回归系数对被解释变量的重要性) 5。回归中使用部分数据(if in) 回归后预测值的获得 Predict 1。拟合值的获得: predict yhat, xb 或者 predict yhat 2。残差的获得 predict e , residuals 或者 predict e, res 3。 残差分布图 rvfplot yline(0) 回归结果的存放:e() e(N) number of observations e(mss) model sum of squares e(df_m) model degrees of freedom e(rss) residual sum of squares e(df_r) residual degrees of freedom e(r2) R-squared e(r2_a) adjusted R-squared e(F) F statistic e(rmse) root mean squared error 可以使用命令 eret list 查看。 回归结果解读 MSS:回归平方和 df1 自由度 MMS=MSS/df1 RSS:残差平方和 df2 RMS=RSS/df2 TSS:总平方和 df3 TMS=TSS/df3 F值:系数的联合检验 R2=MSS/TSS 调整的R2 Root MSE=sqrt(RMS) Coef:回归系数 Std.Err:系数的标准误差 t统计量 t的临界值 p值 95%置信区间 模型常用的其他形式: 对数 半对数 平方项 n次方 指数 交乘项 虽然对函数形式和自变量的选取有选择和检验的方法,但最好还是从“经济意义”角度确定。 例如:考察消费受收入影响的方程,即使参数项不显著,也不能把它删除掉。 例题 例一:利用wage2的数据检验明瑟(mincer)工资方程的简单形式: Ln(wage
文档评论(0)