- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 生物信息数据库 人类基因组计划(Human Genome Project, HGP) 1990年启动,预计2003年完成。由美、日、德、法、英、中六国参加。测出人类约 3,000,000,000 碱基对的序列(相当于每页3,000个字母,共需100万页印完)。中国承担其中的 1%。 模式生物基因组计划 酵母、线虫、果蝇、细菌共约50多种已完成,水稻等70余种正在进行。目前总量已达60亿碱基对! 已经完成全序列测定的基因组 Homo sapiens 智人 Escherichia coli大肠杆菌 Saccharomyces cerevisiae酿酒酵母 秀丽线虫Caenorhabditis elegans一种透明的、生活在海滩泥沙中的小虫。 Drosophila melanogaster果蝇 Arabidopsis thaliana拟南芥 实验一 生物信息数据库信息检索 一、实验内容: 1、 了解NCBI、DDBJ、EMBL上网的方法自学各网站相关介绍。2、 了解北大生物信息学中心等几大中文生物信息学网站。3、 了解一些生物论坛中有关生物信息学的部分。如:Biooo和Bioon。4、 利用NCBI的Entrenz查询系统和EBI的SRS检索文献和核酸或蛋白质序列。(phyA)并对照所学复习各字段的含义。5、 将所得记录的ID或Accession记录下来备用。 二、作业 1、 记录相关网站及论坛网址(或如何查询到该网址的方法)。 (1)NCBI :/ (2)DDBJ? :http://www.ddbj.nig.ac.jp/ (3)EMBL :/ ( 4 )北大生物信息学中心?? /chinese/ (5)中科院计算所智能信息处理重点实验室生物信息学: /index.php (6)北大生物信息中心: /chinese/documents/bioinfor/overview/web1/1.html (7)生物谷:/ (8)中国生物论坛:Http:/// (9)丁香园论坛 : /cms/ (10)生物秀 /Index.htm 2、 找到编码拟南芥(arabidopsis)phyA(光敏色素A)基因的核酸序列编号。并记录查找过程。 一、 引言 除了蛋白质序列数据之外,PIR还包含以下信息: (1)蛋白质名称、蛋白质的分类、蛋白质的来源; (2)关于原始数据的参考文献; (3)蛋白质功能和蛋白质的一般特征,包括基因表达、翻译后处理、活化等; (4)序列中相关的位点、功能区域。 PDB中含有通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子的三维结构 蛋白质 核酸 糖类 其它复合物 一种是隐式序列信息(implicit sequence) PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。 5、蛋白质结构分类数据库 PIR(protein information resource) 1. 由美国NCBI翻译自GenBank的DNA序列(1984年); 2. 在EMBL和GenBank数据库上均建立了镜像站点; 3. 数据依据注释的质量分为4类。 网址: / 196 未翻译(Unencoded or untranslated) PIR4 7508 未核实(Unverified) PIR3 69368 已注释(Annotated) PIR2 13572 已分类、已注释 (Classified and annotated) PIR1 记录数 (Number of entries) 说明 (Comment) 分类名称 (Name) PIR数据库的分类情况(Release 51.03) 目的: 帮助研究者鉴别和解释蛋白质序列信息, 研究分子进化、功能基因组。 它是一个全面的、经过注释的、非冗余的蛋白质序列数据库。 所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。 1、PIR(Protein Information Resource) PIR提供三种类型的检索服务: 一是基于文本的交互式查询, 用户通过关键字进行数据查询。 二是标准的序列相似性搜索, 包括BLAST、FastA等。 三是结合序列相似性、注释信息 和蛋白质家族信息的高级搜索, 包括按注释分类的相似性搜索、 结构域搜索等。 三个子数据库 4、蛋白质结构数据库 PDB(protein data bank) 1. 目前最主要的蛋白质分子结构数据库; 2. 1970年代建立,美国Brookh
您可能关注的文档
最近下载
- 全国计算机等级考试教程二级WPS Office高级应用与设计:为演示文稿添加效果PPT教学课件.pptx VIP
- 2023中国铁建股份有限公司所属单位岗位合集笔试备考题库及答案解析.docx VIP
- 中职物理考试题及答案.doc VIP
- DB21∕T 2449-2015 地理标志产品 西丰柞蚕丝.docx VIP
- 《居住空间设计》中级-多选230题(答案版).pdf VIP
- 智慧树 知到 大学生劳动就业法律问题解读(2024最新版) 章节测试答案.docx VIP
- 2025年菊花种植市场调查报告.docx
- 事业单位考试马克思主义哲学试题300道.pdf VIP
- 外墙保温及涂料施工方案样本.doc VIP
- 施工升降机基础及附着施工方案.docx VIP
文档评论(0)