- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学概述
概念
广义:生物信息学就是从生命现象、实验数据中获取、存储、分析并产生生物学知识的一门学科。
狭义:生物信息学是将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。
发展历史
发展历史
20世纪50年代,生物信息学开始孕育。
20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来。
20世纪70年代,生物信息学的真正开端。
20世纪70年代到80年代初期 ,出现了一系列著名的序列比较方法和生物信息分析方法 。
20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库。
20世纪90年代后 ,HGP促进生物信息学的迅速发展。
21世纪10年代,伴随高通量试验方法的发展(芯片技术、二代测序技术)产生新的分析手段和内容。
21世纪10年代后期到目前,生物信息学与高通量实验共同为系统生物学的快速发展奠定了基础。
主要任务
数据库的构建
算法软件开发
实验数据分析
一级数据库
核酸数据库
NCBI
EMBL
DDBJ
蛋白质数据库
UNIPROT
SWISS-PROT
……
二级数据库
EPD - 真核生物启动子数据库
RDP - 核糖体数据库
PLACE - 植物DNA顺势调控元件数据库
PlantCARE - 植物中DNA顺势调控组件数据库
5S rRNA - 5S核糖体RNA数据库
RNA editing - RNA剪切位点
RNAmod db - RNA修饰数据库
HPRD - 人类蛋白质查询数据库
IntAct - EBI 蛋白质相互作用数据库
GRID - 相互作用综合数据库
在线软件
Blast – 序列比对
SMART – 模体识别
TargetScan – miRNA靶标预测
ORFFinder – 开放阅读框识别工具
DAVID – 综合注释工具
GeneWise – 基因结构分析工具
Swiss-model – 蛋白质三维结构预测
……
本地软件
Blast – 本地版序列局部比对工具
Clustalw – 序列全局比对工具
DNAstar – 综合序列分析工具包
Primer Primer – 引物设计工具
Bioconductor – 高通量数据分析R语言包
MEGA – 进化分析工具包
Blast2GO – 从序列到GO注释
CytoScape – 生物网络分析工具
……
序列分析
序列相似性分析
序列功能元件预测
序列结构分析
核酸序列结构分析
蛋白质二级、三级结构分析
系统发育分析
进化关系分析
物种分类、鉴定
功能保守性分析
基因组分析
基因组组装
基因组注释
识别新基因
基因组比较
转录组分析
差异表达分析
共表达分析
识别非编码RNA
功能注释/通路注释
遗传学分析
SNP分析
Indel分析
基因簇共线性分析
基因性状关联分析
……
生物信息学主流方向
以分子生物学为依托,伴随高通量实验技术的发展而发展。
提纲
基因组学分析
转录组学分析
蛋白组学分析
系统生物学分析
表观组学分析
系统发育分析
医学信息学分析
遗传学分析
基因组学分析
序列拼接
序列比对
功能位点预测
重复序列注释
基因及结构预测
SNP/Indel分析
基因功能注释
宏基因组学分析
序列拼接(基因组、转录组组装)
Genome Assembly Based on Sanger sequencing technology (一代测序)
Genome Assembly by Short Reads (二代测序)
Sequencing depth vs Assembly Results
Evaluation for Assembly Results
N50
Gap
Coverage
二代测序流程
序列比对
全局比对
Clustalw
MUSCLE
HMMER
局部比对
Blast
Blat
Blastz
GeneWise
Fasta
Exonerate
Sim4
功能位点预测
转录起始位点
转录因子结合位点
外显子增强子/沉默子、内含子增强子/沉默子
重复序列注释
重复序列类型
分散重复序列
SINE/LINE/LTR/DNA transposon
串联重复序列
卫星DNA/小卫星DNA/微卫星DNA
常用软件
RepeatMasker(综合型)
RepeatProteinMasker(基于蛋白序列寻找转座子)
Trf(串联重复)
LTR_struc(LTR)
RepeatModeler(RepeatMasker+RECON+RepeatScout+Trf)
基因及结构预测
基因预测
Glimmer
GlimmerM
Genscan
TwinScan
BGF
Fgenesh
基因结构预测
GENSCAN,GENEMA
文档评论(0)