糖尿病新基因SLC30A8的生物信息学分析.docVIP

下载本文档

11
0
约3.23千字
约 5页
2021-04-15 发布于广东
举报
版权申诉

糖尿病新基因SLC30A8的生物信息学分析.doc

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

时间： TIME \@ yyyy年M月d日 2021年3月13日学海无涯页码：第 PAGE 1页共 NUMPAGES 1页 PAGE PAGE 1 糖尿病新基因SLC30A8的生物信息学分析众多研究显示，遗传因素在2型糖尿病(T2DM)发病中起着非常重要的作用〔1，2〕,但由于T2DM系多基因遗传病，研究的进展非常缓慢，直到2005年，不管是采用候选基因法还是连锁定位克隆法，只有极少数几个T2DM的易感基因在一些种族的研究中得到重复验证，而它们仅轻度增加T2DM的发病风险〔3〕。近2年多来，随着高通量SNPS检测技术的出现和全基因组关联(GWA)研究策略的运用，T2DM遗传学的研究取得了一些突破性进展，美国和欧洲多个基因研究组织采用全基因组分析法对1 464例T2DM患者和1 467例糖耐量正常个体的基因结构进行了系统研究,确认了几个与糖尿病相关的新基因位点——TCF7L2、SLC30A8、CDKN2A、CDKN2B、GF2BP2、CDKAL1〔4〕，这些基因的功能和调控机制还不十分清楚。在国内，邬莹等〔5〕研究发现在中国汉族人群中，CDKAL1、CDKN2A/B、SLC30A8等基因上的数个SNP位点与T2DM风险显著相关。SLC30A8基因也是中国人T2DM的一个易感基因，但对SLC30A8基因的研究还不够深入。因此，本文利用生物信息学工具和数据库，对SLC30A8进行分析，研究SLC30A8基因的功能，了解中国人糖尿病的遗传学基础，对预防和控制糖尿病具有重要的理论和临床意义。　　1 材料与方法医学论文发表网站　　1.1 材料人类糖尿病基因SLC30A8核苷酸序列来源于已经提交到GenBank数据库(GI：224589820)的序列。　　1.2 SLC30A8基因结构分析及SLC30A8基因编码蛋白质的理化性质分析通过NCBI的ORF Finder、Protparam、Computer pI/MW确定其完整编码框并预测蛋白质的理化性质;信号肽序列分析采用SignalP工具;蛋白质翻译后修饰的糖基化位点和磷酸化位点分析分别采用DictyOGlyc在线软件和NetPhos 2.0 Server分析;氨基酸序列的同源性比对用ClustalW在线工具完成，通过蛋白分析专家系统Expasy所提供的在线分析工具ProtScale分析蛋白的疏水性。　　1.3 SLC30A8基因编码蛋白质的结构和功能分析利用互联网ExPaSy数据库进行SLC30A8蛋白质的跨膜结构域分析;利用PUMA2服务器的SOPM软件进行蛋白序列的二级结构的分析;利用ExPasy的3djigsaw工具(http://www.bmm.icnet.uk/servers/3djigsaw/)向蛋白质立体结构数据库PDB(Protein Data Bank)提交蛋白质的序列;利用RasMol软件显示蛋白的三维分子结构。利用在线工具TMHMM分析蛋白质的跨膜结构域;利用COILS进行卷曲螺旋分析;利用Pfam进行蛋白的结构域功能分析〔6〕。　　2 结果　　2.1 SLC30A8在染色体上的定位及基因结构人类糖尿病基因SLC30A8的Gene ID是169 026,定位在8q24.11。SLC30A8基因核苷酸序列全长41 617 bp(NC000008.9),含8个外显子。mRNA序列长5 373 bp,编码369个氨基酸的蛋白质(NP776250)，有2个PolyA信号区域分布位于1 933～1 938、 5 353～5 338，5个PolyA位点分别位于1 955、1 961、2 750、2 754、5 373。见表1。表1 SLC30A8外显子序列和对应的mRNA序列　　2.2 SLC30A8基因编码的蛋白基本性质分析　　2.2.1 开放阅读框(ORF)分析 ORF从第231个核苷酸开始,终止于第1 340个核苷酸,由其推导的氨基酸序列以甲硫氨酸为起始氨基酸,长为369个氨基酸。　　2.2.2 疏水性分析疏水性是氨基酸的一种重要性质,疏水性氨基酸倾向于远离周围水分子,将自己包埋进蛋白质的内部,这一趋势加上空间立体条件和其他一些因素最终决定了一个蛋白质折叠形成的三维空间构象〔7〕。通过分析可以得到蛋白质的亲疏水区域,这一结果一方面为二级结构预测结果提供参考,另一方面还可为结构域及功能域的划分提供依据。ProtScale预测结果表明：疏水性最大值为3.044,最小值为-2.889(图1)。　　图1 SLC30A8氨基酸序列的疏水性2.2.3 信号肽、跨膜结构域及翻译后修饰分析进行信号肽分析有助于蛋白质功能域的区分及蛋白质细胞定位。根据SignalP分析，蛋白质C分值、Y分值和S分值分别在248、157和1