A题地贫患者的基因筛查问题.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
A题地贫患者的基因筛查问题

2013高教社杯全国大学生数学建模竞赛 承 诺 书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛 地贫基因问题地中海贫血地中海贫血地中海贫血地中海贫血 关键词:fisher 模型; ;主成分分析法; Matlab; SPSS 问题重述 地中海贫血(简称地贫)是全球广为流行、危害极为严重的遗传性溶血性疾病,全世界至少有3.45亿人携带地中海贫血的致病基因。全球地中海贫血基因携带者频率高达2.62%,包括中国南方在内的东南亚地区、印度次大陆、地中海地区、中东、东非和太平洋地区都是该疾病的高发地区。由于携带者婚配的下一代有1/4的机会患严重溶血性贫血症状的重症地中海贫血,估计全球重型地中海贫血患儿的出生率不低于万分之四,因而构成了严重的公共健康问题。 地贫是一种单基因遗传的血红蛋白病目前没有根治方法,患者轻则无任何临床表现,重则表现为进行性溶血性贫血。医学上通过大人群的基因筛查来预防地贫患儿的出生。 附件(基因链.xls)中给出了60个人的基因链样本(每个人的基因链给出了110个基因)20是地贫样本21~40是健康样本,0个是待的样本。 (1)试设法找出描述地贫患者样本与健康人样本在基因链上的区别,建立数学模型方法,去预测待样本是地贫还是健康。 (2)设计图示可视化方法使所建立的数学模型尽可能清楚地表达地贫与健康样本在基因链上的区别。 问题分析 问题一:我们根据已知确诊病例的两大总体(地中海贫血地中海贫血n 样本点的个数,即模型求解中作为已知的样本点个数 p 地中海贫血症诊断的化验指标个数,也即原始主成分个数 G、G G为地中海贫血症患者类,G为健康类 S 协方差矩阵S i=1,2 类内离散度 i=1,2 x 病例号i在第 j 项指标的化验数据结果 x 病例号i的化验结果x=(x,x,x) x 第j项指标的化验数据结果 y 病例号的Fisher判别函数值,i=1 表示病人,i=2 表示健康人 d、d 分别代表地中海贫血症患者和健康人到其均值水平的马氏距离 X 观察样本矩阵 R 指标数据的相关矩阵 第 个主成分方差贡献率 D 主因子载荷矩阵 四.模型的建立与求解 问题一: 基于费希尔模型,对20名就诊病例进行判别分析的结果见表A.1。 表A.1 41.健康 42.健康 43.贫血 44.贫血 45.健康 46.贫血 47.贫血 48.健康 49.贫血 50.贫血 51.贫血 52.贫血 53.贫血 54.贫血 55.健康 56.贫血 57.健康 58.贫血 59.贫血 60.贫血 属于G类:43,44,46,47,49,50,51,52,53,54,56,58,59,60, 总计16人; G类:41,42,45,48,55,57, 总计4人。 6.1 利用Fisher判别法的模型检验 [3] 代入数据可得出下列结果: = -0.0108,= -0.1515,= -0.0812 给定显著水平a=0.05,从F分布表中查出: 所作出的判别函数有效 问题二: 模型的建立及解答 我们建立了多元统计的模型,将两个变量,即癌症病患和正常者分别设为1及0。其110个基因设为输入层,且这110个基因标号为v29~v110。首先针对这20个癌症及20个正常样本的110个基因进行处理,利用统计软件spss,对这114个基因进行判别筛选,最终得到1个与之相关系数最大的基因,这些基因就成为了判断一个人是否为病者的重要因素。通过这个软件,还可以得到这1个基因的非标准化判别方程系数,从而得出非标准化方程D。 将题目所给的数据录入到该软件中,所得到的结果为: 成份矩阵a 成份 1 VAR00001 -.055 VAR00002 .784 VAR00003 .786 VAR00004 .679 VAR00005 -.687 VAR00006 .721 VAR00007 .024 VAR00008 .114 VAR00009 -.729 VAR00010 .034 VAR00011 -.386 VAR00012 -.675 VAR00013 .617 VAR00014 .081 VAR00015 .795 VAR00016 -.316 VAR00017 .343 VAR00018 .323 VAR00019 .118 VAR00020 .345 VAR00021 -.404 VAR00022 -.731 VAR00023 .110 VAR00024 .151 VAR00025 .283 VAR000

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档