- 4
- 0
- 约2.19万字
- 约 38页
- 2015-12-04 发布于辽宁
- 举报
摘 要
复杂数据主要表现在相依、非线性、维数高与不完全观测等,在股市、基因序列和经济等领域中经常出现。为解决巨型数据集合问题,数据挖掘的理论、方法和技术已应运而生。而针对诸如怎样同时检验成千上万个基因中哪些基因的表达水平有显著性差异之类的高维统计推断问题,以错误发现率为主要特征的非参数估计方法无疑为其提供了一个有效的解决途径。
本文主要研究考察错误发现率的在各种参数模型和非参数模型下的控制检验方法,全文共分为四章。文章首先介绍了所选取课题的背景和意义,以及国内外在该方向的研究现状。在多重假设检验的背景下,给出了错误发现率的定义,提出利用p值进行假设检验,并在假设检验独立和相依的情形下对错误发现率的控制方法进行了探讨。在研究错误发现率的控制方法时,发现在处理多重假设检验问题时,核心的问题是如何估计真实零假设的个数,因此本文采用经验贝叶斯估计来估计它的值。在参数混合模型和非参数混合模型中研究真实零假设的估计问题是本文的核心内容。针对正态混合分布模型和Beta混合分布模型两种参数混合模型,文章采用矩估计方法和基于p值的最小二乘估计方法进行研究;在研究非参数混合模型时,分别介绍了最小二乘估计方法、Beta分布拟合模型和Beinstein多项式拟合模型的方法。文章的最后以Hedenfalk报告的一组乳腺癌患者的基因数据为例进行仿真研究,发现错误发现率为微阵列数据的多重假设检验提供了合适的错
您可能关注的文档
最近下载
- 工程热力学A卷.doc VIP
- JTGG10-2016公路工程施工监理规范.docx VIP
- 质量管理小组活动推进指南(TCAQ10208-2024).docx
- 天气学原理(天气学)全套教学课件.pptx
- 《军事理论教程》第九章 战备基础与应用训练.pptx
- 2024年浙江统一考试中考科学试卷(word版,含答案).pdf VIP
- 2019年最新的ISO27001-2018信息安全风险评估表(ISMS信息安全风险评估).pdf VIP
- (正式版)D-L∕T 1214-2013 9FA 燃气—蒸汽联合循环机组维修规程.docx VIP
- ISO27001信息安全管理体系全套文件+表单新版).doc VIP
- 专科学生职业生涯规划与管理.pptx VIP
原创力文档

文档评论(0)