基因芯片数据研究-计算机应用技术专业论文.docxVIP

基因芯片数据研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因芯片数据研究-计算机应用技术专业论文

箱 箱 要 基因芯片技术能够同时分析成千上万基因的表达水平,这一技术已经广泛应 用于生物学和医学各个研究领域。在其自身迅速发展的同时数据也在不断的增 加,如何有效的处理和管理芯片实验所产生的海量数据越来越引起研究者们的广 泛关注。基因芯片数据分析简单来说就是对芯片的高密度杂交点阵图象处理并从 中提取杂交点的荧光强度信号进行定量分析,通过有效数据的筛选和相关基因表 达谱的聚类,最终整合杂交点的生物学信息,发现基因的表达谱与功能可能存在 的联系。芯片数据挖掘包括众多方面,如图像分析,标准化问题,差异基因确定, 聚类分析等等。本论文主要讨论如何获得可靠的点进入后续分析。使得生物学家 可以挖掘出尽可能多的信息,以及如何利用聚类工具预测基因的生物功能和挖掘 芯片的生物信息。 基因芯片数据中总会有许多弱信号点,这些点的信号值容易被背景或者噪声 掩盖。必须寻找有效的方法分离有价值的弱信号点和背景点或者噪声。我们发现 芯片数据普遍符合分段线性累积分布函数,根据这一特征来确定信号值的阚值。 基于此确定阙值的方法综合考虑了新片中整体信号强度和背景值的影响,可以保 留较多的有价值点,而且不增加假阳性率,芯片数据的可重复性和可靠性也显著 提高。 聚类分析是基因芯片中确定具有相似表达谱的基因组的有效的数据挖掘工 具。通过对这些相似基因的聚类分析,不仅可以对基因豹功能研究绘予提示,还 可以对基因调控途径和调控网络的研究给予启发。本文利用层级聚类法和自组织 图谱法分析细胞诱导表达谱芯片数据,找到了表达谱一致的功能相似基因,同时 也预测了一些有研究价值的新基因。 关键词:基因芯片,弱信号,累积分布函数,整体校正,层级聚类,自组织图谱 AbstracteDNA Abstract eDNA microarray analysis can be used to monitor the expression levels of thousands to tens of thousands of genes in a single assay,which is the most widely used for the study of gene expression patterns 011 a genomic scale.As more and more researchers jump OH the microarray bandwagon,however,it has become increasingly clear that sim#y generating the data is not enough;one must be able to extract from it meaningful information about the system being suited.In the data analysis,intenmty is firstly subtracted from the array image ofhigh-density hybridization spots.Then the effective data is obtained by pre-processing and relevant gene expression patterns are also obtained by clustering.Finally,the relation between gene expression pattern and biological function is found.In this thesis,filtration of unreliable data and clustering method are mainly discussed. In eDNA microarray experiments.a lot of spots with low signal intensities are vulnerable to background and noise biases.It is important to determine an effective threshold,with which one can clearly distinguiSh low abundance genes from baekgroand.A flew threshold determining method for gene expression intensity based on the accumulated distribution is proposed in the thesis.Compared with previo

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档