生物信息学5生物信息数据库.ppt

下载文档 降价啦

25
0
约1.09万字
约 84页
2016-09-13 发布于安徽
举报
版权申诉
保障服务

生物信息学5生物信息数据库.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第三章生物信息数据库人类基因组计划（Human Genome Project, HGP） 1990年启动，预计2003年完成。由美、日、德、法、英、中六国参加。测出人类约 3,000,000,000 碱基对的序列（相当于每页3,000个字母，共需100万页印完）。中国承担其中的 1%。模式生物基因组计划酵母、线虫、果蝇、细菌共约50多种已完成，水稻等70余种正在进行。目前总量已达60亿碱基对！已经完成全序列测定的基因组 Homo sapiens 智人 Escherichia coli大肠杆菌 Saccharomyces cerevisiae酿酒酵母秀丽线虫Caenorhabditis elegans一种透明的、生活在海滩泥沙中的小虫。 Drosophila melanogaster果蝇 Arabidopsis thaliana拟南芥实验一生物信息数据库信息检索一、实验内容： 1、了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。2、了解北大生物信息学中心等几大中文生物信息学网站。3、了解一些生物论坛中有关生物信息学的部分。如：Biooo和Bioon。4、利用NCBI的Entrenz查询系统和EBI的SRS检索文献和核酸或蛋白质序列。（phyA）并对照所学复习各字段的含义。5、将所得记录的ID或Accession记录下来备用。二、作业 1、记录相关网站及论坛网址（或如何查询到该网址的方法）。（1）NCBI ：/ （2）DDBJ? ：http://www.ddbj.nig.ac.jp/ （3）EMBL ：/ （ 4 ）北大生物信息学中心?? /chinese/ （5）中科院计算所智能信息处理重点实验室生物信息学: /index.php （6）北大生物信息中心: /chinese/documents/bioinfor/overview/web1/1.html （7）生物谷：/ （8）中国生物论坛：Http:/// （9）丁香园论坛： /cms/ （10）生物秀 /Index.htm 2、找到编码拟南芥（arabidopsis）phyA（光敏色素A）基因的核酸序列编号。并记录查找过程。一、引言除了蛋白质序列数据之外，PIR还包含以下信息： (1)蛋白质名称、蛋白质的分类、蛋白质的来源； (2)关于原始数据的参考文献； (3)蛋白质功能和蛋白质的一般特征，包括基因表达、翻译后处理、活化等； (4)序列中相关的位点、功能区域。 PDB中含有通过实验（X射线晶体衍射，核磁共振NMR）测定的生物大分子的三维结构蛋白质核酸糖类其它复合物一种是隐式序列信息(implicit sequence) PDB的隐式序列即为立体化学数据，包括每个原子的名称和原子的三维坐标。 5、蛋白质结构分类数据库 PIR(protein information resource) 1. 由美国NCBI翻译自GenBank的DNA序列(1984年)； 2. 在EMBL和GenBank数据库上均建立了镜像站点； 3. 数据依据注释的质量分为4类。网址： / 196 未翻译(Unencoded or untranslated) PIR4 7508 未核实(Unverified) PIR3 69368 已注释(Annotated) PIR2 13572 已分类、已注释 (Classified and annotated) PIR1 记录数 (Number of entries) 说明 (Comment) 分类名称 (Name) PIR数据库的分类情况(Release 51.03) 目的：帮助研究者鉴别和解释蛋白质序列信息，研究分子进化、功能基因组。它是一个全面的、经过注释的、非冗余的蛋白质序列数据库。所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。 1、PIR（Protein Information Resource） PIR提供三种类型的检索服务: 一是基于文本的交互式查询，用户通过关键字进行数据查询。二是标准的序列相似性搜索，包括BLAST、FastA等。三是结合序列相似性、注释信息和蛋白质家族信息的高级搜索，包括按注释分类的相似性搜索、结构域搜索等。三个子数据库 4、蛋白质结构数据库 PDB（protein data bank） 1. 目前最主要的蛋白质分子结构数据库； 2. 1970年代建立，美国Brookh