- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质氨基酸的组合问题 ? 一 . 问题的提出 ? 生命蛋白质是由若干种氨基酸的不同组合构成的 . 各 种氨基酸的已知分子量 a[i](i=1,2,3,4,5……..) 分别如 下 : ? n=18 ? a[1:18]=57,71,87,97,99,101,103,113,114,115,128, 129,131,137,147,156,163,186. ? 给定某一蛋白质的分子量下 X(X≤1000 且为正整数 ) 设计出数学模型给出该蛋白质的所有可能的组成。 即确定该蛋白质是哪几种氨基酸组成及每种氨基酸 的数目 . 二 . 问题的分析 ? 根据给定的分子量 X 及 ai 测定蛋白质的组成 , 实际是求多元线 性方程 : ? ∑aixi= X ? 的所有整数解的问题 . 一般采用枚举法求解 , 即将所有可能的 组合代入方程试验 , 等式成立即为解 . 在本问题中 , 所有可能解 的组合共有 ∏ ([ X/ai ]+1) 种 . 因此对于所有的组合 , 一方面计算 量大 , 耗费时间长 ( 对于计算机尚且如此 , 在没有危机的情况下 更是无法想象的 ); 另一方面 , 给出的解的个数过多反而失去了 解的意义 . 考虑到这一点 , 模型的设计和改进围绕着减少运算 和缩小解的范围的思路展开 , 根据实际化学试验研究中采取的 办法 , 对一般模型加入辅助信息和约束条件 . 对实现模型的程 序的改进则从改良算法和加入合理判断条件出发 . 三 . 模型假设 . ? 1. 给定的蛋白质分子量 --- 和氨基酸已知分子量 --- 是准确的 , 没有测试误差 ; ? 2. 假设所有被测定的蛋白质均由给定分子量的这几种氨基 酸构成 , 而不含有其他种类的氨基酸 . 实际中 , 构成生命蛋白质 的主要氨基酸有 20 种 ----, 其中两对氨基酸的分子量相等 ( 见附 录 c); ? 3. 假设蛋白质分子是构成过程中 , 各个氨基酸分子之间相互 结合的方式不影响蛋白质的分子量 . 通过计算可知 , 给定的已 知分子量均是氨基酸分子失去 1 分子水后的分子量 . 因而在此 假定条件下 , 给定的蛋白质分子量 ----- 只是几个已知分之量之 和而不考虑去他因素 . ? 4. 假设被测定的蛋白质所含氨基酸的个数 =2, 即 x114. ? 5. 假设氨基酸分子结合构成过程中是任意排列组 合的 , 不纯在互斥和互补现象 , 即任何两种氨基酸都 可以同时纯在同一个蛋白质中 , 没有任何一种氨基酸 的存在是以其他氨基酸的纯在为前提的 . 实际中这一 假设是成立的 . ? 6. 假设在蛋白质中 , 每种氨基酸纯在的概率是相等 的 , 不纯在某种必须纯在的氨基酸 . ? 7. 假设该试验拥有测定化学性质的仪器 . 四 . 最一般的模型 ? 在没有任何其他补充信息和约束条件的情况下 , 最一 般的模型可以表示为 ? ∑ a i x i = X ; ? x i 为非负整数, i =1,2,3……n ; ? 该模型的解 ( 及解的个数 ) 是由附录 A 的程序给出的 . 此程序采用了深度优先算法 [7], 遍利了整个解空间 , 由于采用了分支限界 , 其实际最坏的时间效率也是远 小于 ∏ ([ X/ai ]+1) 的 . 下面的表 1 是该模型的实验数据 . 可以看出 , 当分子量每增加 100 时 , 解的个数和运行时 间大约增为原来的 3 倍 . ? 在化学中 , 我们知道 , 生命蛋白质氮的含量约占 总量的 16% 左右 ( 其波动范围 15%--17%). 蛋白 质测定的凯式定氮法 --- 就是利用了这个性质 . 在附录 A 的程序中 , 我们给出了考虑含氮量的 模型 ( 而且下面的几个模型 B,C,D 也考虑了这 种情况 ). ? 在表 1 中 , 已给出了考虑含氮量时的解的个 数和运行时间的数据 . 可以看出 , 经过这种改进 , 效果一般比以前好得多 . 未考虑含氮量的模型 考虑含氮量的模型 蛋白质分子量 X 解的个数 运行时间(秒) 解的个数 运行时间(秒) 200 300 400 500 600 700 800 900 1000 1001 4 14 45 158 522 1508 4291 11249 28268 1 1 2 5 15 43 125 321 810
原创力文档


文档评论(0)