- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分层混合模型在生物学上的应用-应用统计专业论文
独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的 研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人 或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已 在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名:
日期: 年 月 日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
本论文属于
保密□, 在 年解密后适用本授权书。
不保密□。
(请在以上方框内打“√”)
学位论文作者签名: 指导教师签名:
日期: 年 月 日 日期: 年 月 日
华 中科 技大
华 中
科 技
大 学 硕
士
学 位 论
文
I
I
摘 要
微阵列数据的探究,对于人类疾病的控制,特别是癌症的治疗,有着重要的意 义,这些探究需要利用统计学的知识,利用数据分析,从中得到数据中的有用信息, 这样可以对人类基因做进一步的探究,有助于开展疾病治疗的工作。
文章主要是研究微阵列数据的基因表达差异,首先介绍相关的生物学背景知识 理论,国内外的相关研究成果,根据前人的经验,依赖于经验贝叶斯,建立分层混 合模型,接下来用 EM 算法去估计分层混合模型中的参数。通过仿真研究,模拟生 成随机的矩阵,根据分层混合模型建立的统计量去检测错误发现率,与传统的 t 检 验和 Welch 检验做比较,通过改变样本大小以及相关参数,说明分层混合模型的方 法是优于传统的方法的。接下来又模拟了不符合模型的随机矩阵,通过检验发现, 该统计量依然优于 t 检验和 Welch 检验。因此,发现无论数据是否服从模型中的分 布,分层混合模型中的统计量都是优于传统方法的,这种方法对于研究错误发现率 有重要的贡献。接下来引入数据来实现分层混合模型的方法,数据是从 GEO 生物基 因数据库上收集得到的,包括唇腭裂数据和急性心肌梗塞数据,把模型中的方法得 到实际的应用,有效的控制错误发现率,有利于实际问题的研究。
以上研究发现,分层混合模型的方法的错误发现率比传统 t 检验和 Welch 检验 要低。数据分析与生物治疗相结合,错误发现率的研究对于人类基因学,生物学都 有着重大的意义。
关键词:EM 算法;经验贝叶斯;错误发现率;混合模型
II
II
ABSTRACT
The exploration of Microarray data for human disease control, especially in the treatment of cancer, is of great significance, it inquiry to use statistics by using data analysis, we get the useful information from the data, so that we can make further explore of gene, and it is helpful to carry out the treatment.
This article mainly studies gene differential expression of microarray data,first we
introduce biology background knowledge, according to previous experience, rely on empirical bayes, establish a hierarchical hybrid model, then using EM algorithm to estimate the parameter in the model. By simulating random matrix, establish new statistics to test false discovery rate, compared with t test and Welch, by change sample size and related parameters, to show that our method is superior than the traditional methods. Next we simulate a matrix which is not according to the hierarchical hybrid
您可能关注的文档
- 代用燃料内燃机基础MAP研究-车辆工程专业论文.docx
- 代理集群的负载均衡系统设计与实现计算机科学与技术专业论文.docx
- 代用燃料内燃机基础MAP研究车辆工程专业论文.docx
- 代码文件连续变更对软件质量的影响分析-软件工程专业论文.docx
- 代码相似性耦合性度量方法的研究-计算机科学与技术专业论文.docx
- 代码坏味检测方法研究及重构分析-计算机应用技术专业论文.docx
- 代缴费业务系统在银行中间业务平台上的实现-软件工程专业论文.docx
- 代词it的主观化-外国语言学与应用语言学专业论文.docx
- 代表性海区好氧不产氧光合细菌的光合基因(pufM)生态分布特征-环境科学专业论文.docx
- 代谢因素与乳腺癌发生风险的流行病学研究-内科学(内分泌与代谢病学)专业论文.docx
最近下载
- 精益设备管理实战手册.docx VIP
- 当代文学考试题当代文学试题.doc
- 医院建设项目计划书.pptx VIP
- 2024版义务教育(道德与法治)课程标准(含2024年修订部分).pptx VIP
- 2023建筑门窗安装工程技术规程.docx
- DB32_T2334.2—2013《水利工程施工质量检验与评定规范》第2部分:建筑工程.doc
- 2023-2024学年青岛市高二语文上学期期末考试卷附答案解析.pdf VIP
- 外研版英语七上Module4Healthyfood优质单元整体教学设计.pdf VIP
- 2024年贵州贵安发展集团有限公司招聘试题及答案解析.docx
- 消化内镜诊疗技术医疗质量控制指标(2023年版).pptx
文档评论(0)