绒山羊EST序列生物信息学分析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国畜牧兽医学会信息技术分会2012年学术研讨会 绒山羊EST序列的生物信息学分析 白俊艳,王玉琴,庞有志,章森 (河南科技大学动物科技学院,洛阳471003) 摘要:为充分利用现有数据库中的EST资源开发绒山羊的分子标记,以期为研究绒山羊的遗传多样性和利用分子标记辅 这些SSR的长度介于i0~20 含有SSR的EST编码已知功能的蛋白,这些编码的已知蛋白中,有相当部分与角质形成有关,这对于研究绒山羊的皮肤 结构,特别是其产绒性状有重大意义。 关键词:绒山羊;EST:SSR;生物信息学 Sequence 表达序列标签(Expressed Institutesof 研究院(National 已知基因,这是关于EST的首次报道Ⅲ。EST技术应用非常广泛,EST技术可以鉴定基因和发现新基因,利 中进行同源查找,同时将FhESTs序列按密码子推出的氨基酸序列作为查询项在蛋白质信息资源数据库 所代表基因的功能进行分析及鉴定,如果不存在同源序列,则该EST所代表的基因有可能是新基因,有 析时发现了177条新ESTs,并对不同心脏发育时期基因表达特点进行了分析。EST技术还可以用于基因差 异表达的研究,目前已应用EST技术对人体很多组织如心脏、骨骼肌、CD+造血干细胞、肾上腺及垂体 等进行了基因表达谱的研究。 相对于绒山羊山羊基因组,目前可利用的绒山羊山羊分子标记非常少。简单重复序列(Simple sequence 展为从EST(Expressed 降低了分子标记开发成本,发掘效率更高,而且EST来源于表达基因,可直接将找到的有功能的分子标 记与其所在的功能基因联系起来,大大提高了其应用价值。开发绒山羊的EST—SSR分子标记对于研究绒山 羊的遗传多样性、系谱与进化的关系及品种鉴定和培育新品种有重要的意义。 1材料与方法 1.1材料 147 论文集 年5月10日。 1.2方法 1.2.1EST序列预处理 从数据库中直接获取的EST中包含一些低质量片段(100bp),同时存在着带有少量载体序列及末端 存在polyA/T“尾巴”的序列,所以在开发标记之前应去除这些“噪音”。这些处理可通过软件来进行, bp的序列按 照默认的参数进行拼接和聚类。 1.2.2绒山羊SSR的搜索 用SSRIT在线软件进行SSR预测,预测标准:二核苷酸重复次数在5次或5次以上;三至六核苷酸重复 的次数在4次或4次以上;同时也筛选中间被少数碱基(间隔小于i00或等于100)打断的不完全重复的SSR。 1。2。3对含有SSR的EST序列进行功能注释 用BLASTX对非冗余数据库把上述拼接得到的序列逐条进行相似性搜索,对于望值E小于1E一10,相似 度达到40%以上,才可认为同源蛋白或基因‘引。 1.2.4EST序列开放阅读框的理化性质分析 白,针对转化后的蛋白进行氨基酸种类以及分子量等分析,此外还分析了开放阅读框转化后的蛋白的二 级结构以及亲水区和疏水区。 2结果与分析 2.1绒山羊EST的预处理 37条,平均长度为740 419条,平均长度为582 其contigs bp;singlets bp。 2.2EST—SSR的筛选 的8。11%,出现频率(SSR数目与uni—EST数目的比值)为8。77%,平均每10kb就出现一个SSR。其中有3条EST 含有2个或2个以上的SSR,有3个EST包含有复合型SSR。SSR的长度介于i0~20 bp之间,平均长度为18.36 中国畜牧兽医学会信息技术分会2012年学术研讨会 表1不同重复基元的SSR的分布 s个,占二核苷酸SSR的35.7%,平均每50 中,其核苷酸序列重复单元的重复次数在4次有24条,主要为三核苷酸和四核苷酸SSR,重

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档