网站大量收购独家精品文档,联系QQ:2885784924

NCBI中各符号代表的意思.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

NCBI中各符号代表的意思

GenBank中字符的意思

Nucleotide数据库分为三个⼦数据库:

·EST:表达序列标记数据库

·GSS:基因组测序序列数据库

·CoreNucleotide:包含所有未被以上两个⼦数据库收录的核苷酸序列

●MeSH:查询缩写基因的全称

3、RefSeq(ReferenceSequence)序列接受号:

(1)mRNA记录(NM_*):

e.g.:NM_000492

(2)基因组的DNA重叠群(NT_*):

e.g.:NT_000347

(3)完整的基因组或染⾊体(NC_*):

e.g.:NC_000907

(4)基因组的局部区域(NG_*):

e.g.:NG_000019

(5)从⼈类基因组注释、加⼯得到的序列模型(XM,XP,orXR_*):

e.g.:XM_000483

●GenBank记录中特性表中的主要关键词:

关键词解释关键词解释

misc_feature⽣物学特性⽆法⽤特性

表关键词描述的序列

promoter转录起始区

misc_difference序列特性⽆法⽤特性表

关键词描述的序列CAAT_signal真核启动⼦上游的CAAT

盒,与RNA结合相关

conflict同⼀序列在不同的研究

中在位点或区域上有差

TATA_signal真核启动⼦的TATA盒

unsure序列不能确定的区域-35_signal原核启动⼦中的-35框old_sequence该序列对以前的版本做

过修订

-10_signal原核启动⼦的Pribow盒variation包含稳定突变的序列GC_signal真核启动⼦的GC盒modified_base修饰过的核苷酸

RBS核糖体结合位点

gene已识别为基因或已命名

的序列区域polyA_signalRNA转录本的剪切识别

位点

misc_signal⽆法⽤信号特性关键词

描述的信号序列

enhancer增强⼦

关键词解释关键词解释

attenuator与转录终⽌有关的序列CDS蛋⽩质编码序列terminator转录终⽌序列sig_peptide编码信号肽的序列

rep_origin双链DNA复制起始区transit_peptide转运蛋⽩编码序列misc_RNA⽆法⽤RNA关键词描述的

转录物或RNA产物

mat_peptide编码成熟肽的序列prim_transcript初始转录本intron内含⼦

precursor_RNA前体RNApolyA_siteRNA转录本的多聚腺苷

酸化位点

mRNA信使RNArRNA核糖体RNA

5’clip前体转录本中被剪切掉的

5端序列

tRNA转运RNA

3’clip前体转录本中被剪切掉的

3端序列

scRNA⼩细胞质RNA

5’UTR5⾮翻译区snRNA⼩核RNA

3’UTRexon3⾮翻译区

外显⼦

snoRNA加⼯和修饰rRNA的⼩

核RNA

关键词解释关键词解释immunoglobulin_relatedrepeat_unit单个的重复元件

C_region免疫相关蛋⽩上的不变区LTR长末端重复序列D_segment免疫球蛋⽩重链的可变

区,

T细胞受体β链

Satellite卫星重复序列

J_segment免疫球蛋⽩重链、轻链以

及T细胞α、β、γ的结

合链misc_binding⽆法描述的核酸序列

结合位点

N_region插⼊重排免疫球蛋⽩⽚段

间的核苷酸primer_bind复制、转录的引物结

合位点

S_region免疫球蛋⽩重链的开关区protein_bind蛋⽩质结合区

V_region编码免疫球蛋⽩的可变区

N末端的序列

STS测序标签位点

V_segment编码免疫球蛋⽩的可变区

的序列misc_recomb⽆法⽤重组特性关键

词描述的重组事件

repeat_region基因组中所包含的重复序

列iDNA通过重组所消除的

DNA

misc_structure⽆法⽤结构关键词描述的

核酸序列⾼级结构或构型

stem_loop发夹结构

D_loop线粒体中DNA中的取

代环

◆GenBank记录中特性表中的限定词:

限定词含义限定词含义

/allele=给定基因的等位基

因/codon_start=相对于序列第⼀个碱

基,编码序列密码⼦的

偏移量

/bound_moiety=嵌合范围/country=DNA样本的来源国

/cell_type=获得序列的细胞类

型/db_xref=其他数据库信息的交

叉索

文档评论(0)

智洲云帆 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档