出芽酵母基因序列GC含量统计.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
出芽酵母基因序列GC含量统计

出芽酵母基因序列GC含量统计小组成员:崔泽嘉 张娟荣 杨家珺 何 京(2013-2014学年第二学期)目录一、课程项目报告—————————————————1二、小组成员及主要贡献——————————————2三、报告内容———————————————————3四、实验过程———————————————————4五、实验结果———————————————————6六、误差来源及分析————————————————7七、生物学意义——————————————————8八、参考文献———————————————————10小组成员及主要贡献姓名班级主要贡献崔泽嘉生物信息1202程序编写张娟荣生物信息1202文献资料查阅杨家珺生物信息1202PPT制作与演讲何京生物信息1202课程项目报告制作二、报告内容1、基本要求:基因和基因间序列作为两个独立样本;每个基因序列(或基因间序列)作为一个个体;GC含量作为随机变量;比较两个随机变量分布特征;阐述其生物学意义。GC含量=GC数量/基因长度2、猜想:1.基因中的GC含量较高原因:CG含量与DNA的稳定性有关,为了保持基因的稳定性,可能GC含量较高。 2.基因间的GC含量较高原因:由于基因片段除了复制之外,还需要转录,为了及时方便的打开,可能GC含量较少。实验过程及结果分析GC含量的生物学意义三、实验过程1、主要思路:编写程序导入基因文件,编写函数循环计算每段序列的GC含量,将计算好的每段GC含量存入一个数组,再从数组中计算总体的均值及方差。2、设计方案:调用ifstream file输入基因文件,按顺序向前搜索,每遇到“”调用getline函数一行一行读基因序列,若遇到”G”或”C”则计数,否则继续向前搜索.编写jisuan函数统计每段GC含量,为了确保jisuan函数程序能够循环调用,使用return语句返回函数。创建数组H[]存放每段计算出的GC含量,再编写程序计算各段GC含量的均值及方差。3、定义:样本:基因组序列、基因间序列个体:每一段基因序列随机变量:GC含量4、主要代码:#includeiostreamusing namespace std;#includefstream//头文件以进行文件输入#includesstream//头文件以创建类double Jisuan(string jy){int t,m=0,n=0,i=0;double h;while(jy[i]!=\0){if(jy[i]==C||jy[i]==G){m++;i++;}elseif(jy[i]==A||jy[i]==T){n++;i++;}elsei++;}t=m+n;if(m!=0n!=0){h=double(m)/double(t);couthendl;return h;//返回函数}else return 0;}int main(){double H[7000];//创建数组double aver=0;double vari=0;int j=0;string line;ifstream file(F:\orf_coding_all_R64-1-1txt);//导入文件while(file){getline(file,line,);//遇到’’开始按行读H[j]=Jisuan(line);j++;}//coutjendl;for(int i=0;ij;i++){//coutH[i]endl;aver+=H[i];}aver=aver/i;cout平均值:averendl;for(i=0;ij;i++){vari+=(H[i]-aver)*(H[i]-aver);}vari=vari/i;cout方差为:variendl;return 0;}五、实验结果1、计算结果基因基因间均值:0.40238均值:0.339116方差:0差:0.003281092、试调分析基因组序列基因间序列基因组序列GC含量分布条形图基因组序列GC含量分布条形图六、误差来源及改进误差:程序计算误差;绘图误差。改进:代码可进一步简短;使用perl、python语言更简单;用matlab绘图更直观。七、实验心得及体会通过本次的课程设计提高了我们的编程及创新能力,文献阅读能力,PPT制作水平等,促进了大家的交流合作,同时使我们对C++编程有了更深的理解,但是由于学得不深,对于文件的导入、函数的循环调用等不是很了解,不太清楚计算机到底是怎样存储的数据的,数据存储的利用率的高低。以后要加强理论知识的学习与实践操作能力的培养,熟练掌握一门编程语言,争取早日成为一名合格的生物信息人。八、生物学意义背景:GC含量是在所研究的对象(例如放线菌)的全基因组中,(鸟嘌呤)(Guanine)和胞嘧

文档评论(0)

haocen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档