- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
广义变系数模型B样条估计及R软件实现
广义变系数模型B样条估计及R软件实现
摘 要:结合基函数逼近技术以及拟似然方法,对广义变系数模型,提出了一个B样条估计方法,并结合R统计软件,对所提出的估计方法给出了一个基于R软件的实现过程。数据模拟表明所提出的B样条估计方法以及R软件的实现过程均是可行的。
关键词:广义变系数模型;B样条;R软件
中图分类号:F22 文献标志码:A 文章编号:1673-291X(2013)01-0231-03
引言
基于广义线性模型的统计分析常常被用于生物、医学、金融工程等各个领域。该模型有两个基本的假定:一是在给定协变量X的条件下,响应变量Y的条件分布属于某一指数分布族;二是通过某一变换,该模型可以转化为线性回归模型。但是,在实际问题分析中,假定协变量X与响应变量Y满足某一线性结构的参数模型往往是不成立的。如下的广义变系数模型是经典广义线性模型的一个简单而有意义的推广。
注意到在模型(1)中,回归系数可以随着协变量U的变化而变化,因此该模型在表达协变量与响应变量的关系上,具有更强的适应性和解释能力。另外,显然当为某一未知参数向量时,模型(1)就转化为经典的广义线性模型。因此,模型(1)可以看成经典广义线性模型的一个推广形式。
目前,模型在统计领域中的应用越来越受到人们的关注,并且关于模型(1)的研究也已有大量的文献。比如 Cai 等研究了模型(1)的有效估计以及拟合优度检验问题。Lian在高维数据下,考虑了模型(1)的变量选择问题。Kuruwita等 则在联系函数未知的情况下,来研究模型(1)的估计问题。在本文中,我们主要考虑模型的B样条估计问题。结合基函数逼近技术以及拟似然方法,对模型(1)提出了一个B样条估计方法.并结合R统计软件,对所提出的估计方法给出了一个基于R软件的实现过程,数据模拟表明所提出的B样条估计方法以及R软件的实现过程均是可行的。
与核估计以及局部多项式估计等局部非参数估计方法相比,B样条估计有其独特的优势。比如,B样条估计属于整体非参数估计方法,在估计过程中可以充分利用样本的信息,因而具有相对较高的估计精度。关于B样条估计的更多性质,参见文献 [6]。
一、方法论和主要结果
(一)B样条估计过程
那么关于γ的拟似然函数可以定义为:
(二)R软件的实现过程
在统计分析领域,常用的统计软件有SAS、SPSS、S-Plus以及R等。其中R软件是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统、数组运算工具、完整连贯的统计分析工具、优秀的统计制图功能、简单而强大的编程语言等功能。在Tiobe公布的2011年11月编程语言排行榜上,R语言位列第二十七位,市场占有率是0.5%,SAS是0.386%,排在第三十五位。可见R软件是目前用户增长最快,且已成为了统计学家和数据分析师所钟爱的统计软件之一。接下来,我们利用R软件,对上节所提出的估计方法给出一个具体的实现过程。
首先我们以3次B样条为例,给出B样条基函数的程序代码,其他阶数的B样条基函数程序可以类似地给出。程序中u为样条函数的自变量,m为样条函数的阶数,kk为内部节点个数,ul为自变量u的取值下限,uu为自变量u的取值上限。
接下来,我们给出函数系数β(u)估计的程序代码,其中x和u为协变量,y为响应变量,m为B样条的阶数,kk为内部节点个数。在该程序中,我们采用的是等间距节点。
二、模拟研究
接下来我们通过数字模拟实验来说明本文提出的估计方法以及算法的可行性。为实施模拟,我们假定数据满足的广义变系数模型为变系数泊松回模型,即响应变量Y服从泊松分布,并且假定其条件均值具有如下结构:
运行上述程序代码,则得出下页图1的模拟结果,其中实线代表真实的函数曲线,点虚线代表利用本文的方法给出的估计曲线。从图1可以看出,估计曲线可以很好地拟合真实曲线。这也表明本文提出的估计方法以及给出的R程序代码是行之有效的。
参考文献:
[1] Cai Z,Fan J Q,Li R.Efficient estimation and inferences for varying-coefficient models[J].Journal of the American Statistical Associ-
ation,2000,95:888-902.
[2] Lian H.Variable selection for high-dimensional generalized varying-coefficient models[J].Statistica Sinica,2012,22:1563-1588.
[3] Kuruwita C N,Ku
文档评论(0)