生物信息学的算法.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学的算法会计学第1页/共30页§1生物信息学研究方法概述1.1 生物信息学研究的三个层面初级层面中级层面高级层面第2页/共30页初级层面基于现有的生物信息数据库和资源,利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题——生物信息数据库(NCBI、EBI等)——基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等)——系统发育树构造软件(PHYLIP、PALM、MEGA等)——分子动力学模拟软件(GROMACS、NAMD等)——搜集、整理有特色的生物信息学数据集第3页/共30页中级层面利用数值计算方法、数理统计方法和相关的工具,研究生物信息学问题——概率、数理统计基础——科学计算基础——现有的数理统计和科学计算工具(EXCEL、SPSS、SAS、 MATLAB等)——建立有特色的生物信息学数据库第4页/共30页高级层面提出有重要意义的生物信息学问题;自主创新,发展新型方法,开发新型工具,引领生物信息学领域研究方向。——面向生物学领域,解决生物学问题——数学、物理、化学、计算科学等思想和方法——建立模型,发展算法——自行编程,开发软件,建立网页(Linux系统、C/C++、PERL、数据库技术)第5页/共30页从事生物信息学研究应具备多方面的科学基础:(1)、一定的计算能力,包括相应的软、硬设备。要有各种数据库或者能与国际、国内的数据库系统进行有效的交流。要有发达、稳定的互联网络系统;(2)、强有力的创新算法和软件。没有算法创新,生物信息学就无法获得持续的发展;(3)、与实验科学,特别是与自动化的大规模高通量的生物学研究方法与平台技术建立广泛、紧密的联系。这些技术,既是产生生物信息数据的主要方法,又是验证生物信息学研究结果的关键手段。从事生物信息学研究的人员必须具备多学科交叉的知识。第6页/共30页1.2生物信息学的“降龙十八掌”第7页/共30页第一式 见龙在田 (1)要掌握生物信息数据库及其查询搜索方法(Database searching)——对分子生物信息数据库的种类以及某些具体数据库的掌握和了解——从现有数据库中熟练获得需要的数据信息(尤其是二级数据库)——能熟练地进行数据库查询和数据库搜索(数据库查询系统Entrez、SRS;搜索工具BLAST等)——数据库技术、互联网技术第8页/共30页第二式 飞龙在天(2)要学会生物信息学软件和工具的应用(Software application)利用成熟的生物信息学工具(专业网站、软件)解决生物信息学问题——基因组序列分析、序列比对软件(GCG、BLAST、CLUSTAL等)——系统发育树构造软件(PHYLIP、PALM等……)——基因芯片检测分析软件(商业软件ScanArray、Array-Pro等 ……)——分子动力学模拟软件(GROMACS、NAMD等……)第9页/共30页第三式 鸿渐于陆(3)概率论基础(Probability theory)——随机事件、概率——随机变量、概率分布——大数定律、中心极限定理——几乎用于生物信息学的各个方面“Most of the problems in computational sequence analysis are essentially statistical.”——“Biological sequence analysis”第10页/共30页第四式 或跃在渊(4)数理统计基础(Statistical methods)——样本和统计量(方差、均值……)——参数估计、假设检验——基本的统计分析(方差分析、协方差分析、回归分析)——常用统计软件的运用(SPSS、SAS)——几乎用于生物信息学的各个方面第11页/共30页第五式 羚羊触藩 (5)基于频率的组分分析方法和权重矩阵方法(Composition analysis weight matrix method)——符号(如碱基)频率反映具有生物学意义的序列特征,如内含子剪接位点的发现,KOZAK规则的发现等——核酸组分、氨基酸组分、密码子使用频率——主要用于具有特定生物学意义的序列特征的分析供体位点受体位点R = A or GY = C or UN = A, G, C or U第12页/共30页权重矩阵分析方法举例——针对序列信号(一段核酸、蛋白),计算每一位点所使用的词汇或叫符号(碱基、氨基酸)频率,频率的偏好性反映信号的序列特征(sequence pattern)。例:人类基因内含子/外显子剪接位点的序列特征分析第13页/共30页Bayesian打分函数用于剪接位点预测的公式The likelihood that a property value v (of a new structure) is drawn from the

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档