生物信息学作业题目郝柏林.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《生物信息学》作业题目(郝柏林) 试估计地球上出现智人以来,人们所讲过的“字”的总和不超过10的多少次方? 试计算10μg大肠杆菌基因组DNA样品中包含多少个DNA大分子?已知1个E. coli. 基因组DNA=4.64×106bp,1bp?650 dalton(分子量);1molH原子=NA个H原子=1g,NA =6×1023。 正态分布下, 1-4个标准差(?)范围所覆盖的(即?±1~4?)概率分别为多少? 假设赌场的骰子中99%是好的,即P(Dfair)=99/100,1%是做过手脚的,即P(Dload)=1/100,如果使用的是做过手脚的骰子,则出6点的概率为1/2。问:(1)在投骰子时连续出了3个6点,你有多大把握说所用的骰子是做过手脚的?(2)如果你要用99%的把握说骰子是做过手脚的,则在投骰子时需要连续出多少个6点? 某一序列为gtgcaatcagactgataattgccacgatcag(L=31),问该序列是否为CpG island?已知下列转移矩阵: P??(+) a+ c+ g+ t+ a+ 0.180 0.274 0.426 0.120 c+ 0.171 0.367 0.274 0.188 g+ 0.161 0.339 0.375 0.125 t+ 0.079 0.355 0.384 0.182 P??(-) a- c- g- t- a- 0.300 0.205 0.285 0.210 c- 0.322 0.298 0.078 0.302 g- 0.248 0.246 0.298 0.228 t- 0.177 0.239 0.292 0.292 从地点A到地点B有多条路线,每条路线都要收取(或得到)一定的过路费(如图): 1 1 2 1 1 1 2 1 2 2 2 1 1 1 2 2 2 1 A B 试问从地点A到地点B的哪条路线得钱最多? 请分别用动态规划法(dynamic programming)Needleman-Wunsch和Smith-Waterman算法对下列两条蛋白质序列进行联配,并写出联配方案: P1=HEAGAWGHEE, P2=PAWHEAE 其中替换矩阵选用BLOSUM50(女生)和BLOSUM62(男生)(见下表,其中括号中的数字属于BLOSUM62),空位(gap)罚分设定为8(女生)和9(男生)。 A E G H P W A 5(4) -1 0 -2 -1 -3 E 6(5) -3(-2) 0 -1 -3 G 8(6) -2 -2 -3(-2) H 10(8) -2 -3(-2) P 10(7) -4 W 15(11) 题1: 可以认为每人平均每秒钟讲的字不超过1个,另智人出现在4?105年前,从有智人以来到现在的世界平均人口不会超过4?109人(以目前世界人口80亿计,人口增长为指数增长),每年365天总计3.2?107秒,由此可以粗略地估计出地球上出现智人以来,人们所讲过的“字”的总和不超过10的22次方(即4?105?4?109?3.2?107=5?1022)。 题2: 根据题意可以计算得到1bp?650 Dalton=650?106/(6×1023)=1.08?10-15μg, 1个E. coli. 基因组DNA=4.64×106bp?4.64×106?1.08?10-15μg=5.01?10-9μg,则10μg大肠杆菌基因组DNA样品中包含10/(5.01?10-9)?2.0?109个DNA大分子。 题3: ?±1~4?所覆盖的概率分别为:0.6826、0.9545、0.9973和1.0000。 题4: 首先算出连续出3个6点的概率P(6?3): P(6?3)=P(6?3, Dfair)+ P(6?3, Dload)=P(6?3|Dfair) P(Dfair)+ P(6?3|Dload) P(Dload)=(1/6)3?(99/100)+(1/2)3?(1/100)=5.83?10-3 则在这种情况下骰子是被做过手脚的概率P(Dload|6?3)为: P(Dload|6?3)=(P(6?3|Dload) P(Dload))/ P(6?3)=(1/2)3?(1/100)/5.83?10-3=0.2144 (2)假设在投骰子时连续出n个6点才有99%的把握说骰子是做过手脚的,即P(Dload|6?n)=0.99,则 P(Dload|6?n)= (P(6?n|Dload) P(Dload))/ P(6?n)= (P(6?n|Dload) P(Dload))/(P(6?n|Dfair) P(Dfair)+ P(6?n|Dload) P(Dload))= (1/2)n?(1/100)/((1/6)n?(99/100)+(1/2)n?(1/100))=(1/2n)/(1/2n

文档评论(0)

jinxuetong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档