- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
条件确切推断完排列算法研究及医学应用
摘要
本次研究在对确切推断有关文献、算法的全面收集、整理和分析基础
上,指出了目前确切推断理论与算法方面存在的主要问题,其一是确切检
验方法体系及相关软件尚不完整,主要表现在大多数专业统计软件中提供
的确切检验方法基本局限于列联表资料的假设检验;其二是算法和程序实
现手段单一,主要表现在算法选择问题上,大多数专业统计软件单纯选择
网络算法。由此,对应用于其它数据资料和模型的确切检验方法以及效率
更高、更具特色的算法进行研究,具有重大的意义。本次研究即在这一背
景下,结合医学领域数据特点,对列联表条件确切检验、Hardy—Weinberg
平衡条件确切检验和列联表对数线性模型拟合优度确切检验的有关假设检
验方法进行了较为全面的分析,并系统地提出了相应的基于递归技术和数
据库技术的完全排列算法。
在列联表条件确切检验方面,分别对2×2、2×C、,×c列联表资料,
方法、参照系及排列表确切概率等内容进行了系统的分析与讨论。对于
2×2列联表,不同的资料收集方式,即完全随机设计和配对设计,对应了
两类不同的检验方法,由于其确切检验参照系不同,对应的完全排列算法
也不相同;对于2×c列联表,尽管列分类变量可为有序或无序变量,相应
的假设检验方法也比较多,但其确切检验参照系是相同的,从而仅需设计
一种完全排列算法,通过构造不同的检验统计量,即可实现不同的确切检
验:r×c列联表的情形与2×c列联表类似,不同的资料收集方式和不同的
分类变量属性,可分别对应不同的假设检验方法,但其确切检验参照系是
相同的,从而通过构造不同的检验统计量,使用共同的完全排列算法,即
可实现不同的确切检验;对于各种分层列联表资料,一般来说,首先应进
行各层之间的齐性检验,如满足齐性要求,可进一步就行列分类变量之间
关联关系进行相应的假设检验,此两类检验分别对应了两种不同的完全排
列算法,齐性检验对应于三维列联表对数线性模型齐性关联模型的拟合优
度确切检验,而关联关系检验对应于三维列联表对数线性模型条件独立模
型的拟合优度确切检验。在算法的构造与实现方面,本研究从一维列联表
II
入手,通过分析列联表各格与其合计之间存在的递归关系,构造其递归完
全排列算法;对于二维列联表,则从分析二维列联表的一行与剩余子表之
间关系入手得出其递归关系,从而构造出相应完全排列算法,且通过严格
的递归关系定义,有效解决了过度排列问题。
在Hardy—Weinberg平衡条件确切检验方面,分别对群体遗传学中二等
位基因系统、复等位基因系统数据资料的结构及特点、适用检验方法、参
照系及排列表确切概率等进行了系统的分析与讨论。因二等位基因系统为
复等位基因系统的特殊情形,因而可构造共同的完全排列算法。本次研究
提出了基于递归技术的完全排列算法,同时提出了针对解决过度排列问题
的基于等位基因位置动态调整的递归完全排列算法,通过将各等位基因的
名称与其在数据表格中的位置分离,可在递归过程中有选择地调整等位基
因所处位置,从而根本解决复等位基因情形下出现过度排列现象的问题。
在列联表对数线性模型拟合优度确切检验方面,以三维列联表为主,
分别对完全独立模型、联合独立模型、条件独立模型和齐性关联模型的数
据结构特点、适用检验方法、参照系及排列表确切概率等进行了系统的分
析与讨论,提出了各自的递归完全排列算法。对于完全独立模型(c,A,
B),由于其参照系的约束条件较为宽松,故采用将列联表拉直的方法,即
将三维列联表转换为具有相同格数的一维列联表,并借鉴一维列联表的相
关算法构造出适用的完全排列算法:对于联合独立模型(C,AB),其确
切检验与变量c和变量A、B各交叉分类组成的二维列联表的确切检验等
价;对于条件独立模型(CA,CB),因其排列表总数为各层之二维列联表
排列表总数的迪卡尔乘积,通过使用SQL语言对关系型数据库的数据表交
叉连接的巧妙运用,提出了独具特色的完全排列算法;对于齐性关联模型
(CA,CB,AB),根据其参照系要求,通过对三维列联表进行逐层分解
以定义其各层与剩余子表之间的递归关系,提出了基于递归技术的三维列
联表完全排列算法。
本次研究依据所取得的研究成果制作了采用递归完全排列算法进行确
viaTotal
切检验的专用统计软件ETE(ExactEnumeration),本软件使用
UI
库系统Ad
文档评论(0)