- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医学论文-Possion回归模型分析在不同地区乳腺癌发病率比较中的应用
医学论文-Possion回归模型分析在不同地区乳腺癌发病率比较中的应用
?????????????????? 作者:沙海滨 贺圣文 陈景武 曹伟燕 王园园?
【摘要】? 据国际抗癌协会资料统计,乳腺癌是女性发病率较高的恶性肿瘤之一,全世界每年约120万妇女发病。其中,我国妇女乳腺癌的发病率呈上升趋势,成为危害女性健康的主要杀手,尤其是沪京津和沿海地区是我国妇女乳腺癌的高发地区。为了掌握乳腺癌的地区流行病学特点, 探讨有效的干预措施,进一步做好妇女保健工作,以2000~2005年北京和成都部分区县妇女病抽样调查结果为资料来源进行乳腺癌的possion回归模型分析,比较两地妇女乳腺癌发病的地域差异。
【关键词】? Possion回归模型分 乳腺癌发病率 地区差异
1? 研究资料与方法
1.1? 资料来源[1,2]
??? 资料源于2000~2005年北京和成都部分区县妇女病抽样调查结果,两地均采用整群抽样,调查项目基本一致,数据资料准确可靠,见表1。表1? 2000~2005年北京和成都部分区县妇女乳腺癌(略)
1.2? 研究方法
??? 表1显示观察人数多,但是发病人数少,可以认为该病发生是小概率事件,且具有独立性,而possion分布作为二项分布的一种特例,已发展成为描述小概率事件发生规律性的一种重要分布,它可以用来分析医学上诸如人群中遗传缺陷、癌症等非传染性疾病的发病情况,同时,每个样本都是相对独立的,这些都符合possion回归模型分析的应用条件,所以,我们采用此方法分析数据。本研究为了分析乳腺癌发病的地区差异和年份变化,以发病情况y为应变量,设y=1表示发病,y=0表示未发病;以年份x为协变量,由远及近分别赋值1,2,…,6;同时,城市z也为协变量,设z=1表示北京,z=2表示成都。采用SAS编程分析数据,在SAS数据步中建立了6个哑变量。方法介绍如下:
1.2.1? possion回归模型[3]
??? Possion 回归模型是用来分析服从possion分布的随机变量y的均数与协变量之间变化关系的一种回归模型。记p个协变量为x1,x2,…,xp ,则possion回归模型的一般形式为:
??? μ=eβ0+β1x1+β2x2+…+βpxp=eβ0+pj=1βjxj? ??? 其中,式中参数μ为总体均数,β1,β2,…,βp 是模型中待估计的未知参数。显然,eβ0 表示当所有的协变量均为0时,相应的possion分布的总体均数。
1.2.2? 模型的参数估计
??? 根据函数关系表达的形式,式μi=∏kj=1exp(βjxji)和lnμi=∑kj=1βjxji 分别被称作乘法模型和加法模型。Possion乘法模型与possion加法模型的最大区别在于自变量对事件发生数的影响形式,前者是指数相乘的,后者是线性叠加的。前者将自变量的线性预测区间(-∞,+∞) 变换到(0,+ ∞),保证了平均事件数的估计为正数;而后者所得平均事件数的估计就是自变量的线性预测,因此可能是负的,特别是在平均事件数较小的情形。故在应用上受到限制。实际应用时多采用possion乘法模型[4]。其中,这两者都仅βj 是未知参数,可采用最大似然法进行估计[5,6]。似然函数的构造如下:
??? L=∏f(Yi)=∏(eβ0+∑βjxj)yie-eβ0+∑βjxj∏Yi !??? 将式两边取以自然数e为底数的对数,并就lnL分别对β0,β1,…,βp 求偏导数,并令其等于零得到p+1个方程,采用迭代法解此方程组,即得参数β0,β1,…,βp 的估计b0,b1,…,bp 。
1.2.3? 模型拟合优度评价与模型选择[3]??? 实测数据拟合模型的好坏,可通过如下的x2 统计量进行检验:
??? χ2=-2{ lnL(当前模型)- lnL(饱和模型)}
??? 它的自由度df=(样本容量-当前模型中独立参数独立参数的个数) 。拟合优度χ2 统计量值越小,对应的p值越大,表明数据拟合模型的效果越好。一般而言,p>0.05即可认为所给资料拟合相应的possion回归模型是合适的。这里,式中的饱和模型是指模型的自由度等于模型中独立参数的个数。
1.2.4? Possion回归模型的相对危险度估计
??? 根据相对危险度的定义,在其他协变量不变的条件下,协变量xj 每增加一个单位所引起相对危险度的估计值为:??? RRj=ebj
而RRj 的95%置信区间为:ebj±1.96SE(bj) 。其中,SE(bj) 是bj 的标准误[3]。
2? SAS分析结果及解释
??? 表2中,应变量Y的取值排序是1和0,所以拟合的是y=1的概率模型,即拟合的是乳腺癌发病的概率模型。表2? 应变量取值排序(略)
?
文档评论(0)