- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北邮生物信息基础期末作业
《生物信息基础》期末作业
PAGE \* MERGEFORMAT9
目 录
TOC \o 1-3 \h \z \u HYPERLINK \l _Toc440754723 一、 疾病自动诊断问题 PAGEREF _Toc440754723 \h 2
HYPERLINK \l _Toc440754724 1、 设计思路 PAGEREF _Toc440754724 \h 2
HYPERLINK \l _Toc440754725 2、 基于K-L变换的主成分分析法 PAGEREF _Toc440754725 \h 2
HYPERLINK \l _Toc440754726 3、 近邻法判别分析 PAGEREF _Toc440754726 \h 3
HYPERLINK \l _Toc440754727 二、 病毒变异与否的判断 PAGEREF _Toc440754727 \h 4
HYPERLINK \l _Toc440754728 1、 设计思路 PAGEREF _Toc440754728 \h 4
HYPERLINK \l _Toc440754729 2、 基本步骤 PAGEREF _Toc440754729 \h 4
HYPERLINK \l _Toc440754730 3、 星型比对算法 PAGEREF _Toc440754730 \h 4
HYPERLINK \l _Toc440754731 4、 两两比对算法 PAGEREF _Toc440754731 \h 5
HYPERLINK \l _Toc440754732 5、 寻找变异位点 PAGEREF _Toc440754732 \h 5
HYPERLINK \l _Toc440754733 三、 基因编码区域识别 PAGEREF _Toc440754733 \h 5
HYPERLINK \l _Toc440754734 1、 设计思路 PAGEREF _Toc440754734 \h 5
HYPERLINK \l _Toc440754735 2、 问题建模 PAGEREF _Toc440754735 \h 5
HYPERLINK \l _Toc440754736 3、 参数估计与计算过程 PAGEREF _Toc440754736 \h 6
HYPERLINK \l _Toc440754737 4、 实验结果 PAGEREF _Toc440754737 \h 7
HYPERLINK \l _Toc440754738 四、 隐马尔科夫模型的求解 PAGEREF _Toc440754738 \h 7
HYPERLINK \l _Toc440754739 1、 设计思路 PAGEREF _Toc440754739 \h 8
HYPERLINK \l _Toc440754740 2、 问题建模 PAGEREF _Toc440754740 \h 8
HYPERLINK \l _Toc440754741 3、 参数估计与计算过程 PAGEREF _Toc440754741 \h 9
HYPERLINK \l _Toc440754742 4、 计算结果 PAGEREF _Toc440754742 \h 9
HYPERLINK \l _Toc440754743 五、 课堂内容回顾 PAGEREF _Toc440754743 \h 10
《生物信息基础》期末作业
疾病自动诊断问题
设计思路
根据题目,我们获得80份腹泻类型为细菌型的常规化验结果数据,以及20份腹泻类型为病毒型的化验结果数据,基于以上100份数据中的20项数值型结果,我们将其作为分类器训练集,设计出合理的算法将某常规化验结果分类,判断其腹泻类型。该计算机自动诊断方案包括以下部分:
其中,信息获取与预处理,即为通过常规化验,采集化验所得的20项数据结果x=(x1,x2,x3,x4,…,x17,x18,x19,x20)
基于K-L变换的主成分分析法
主成分分析的基本思想是进行特征降维的变换,虽然不能完全地表示原有的对象,能量总会有损失,但是希望找到一种能量最为集中的变换方法使得能量损失最小,即根据已知向量,将其做变换得到一组互不相关新的特征,对新特征向量进行排序,舍掉最小的特征,从而使得损失的能量最小。
K-L变换的基本算法
原始输入为x=(x1,x2,x3,x4,…,x17,x18,x19,x20)T,变换后特征为y,变换矩阵(线性变换)为A,则y=ATx,变换后的相关矩阵则Ry=AT
主成分分析的基本算法
通过K-L变换时特征降维,原有N维,只保留m维,去掉ym+1…yN,若希望和原来的表示方法差别最小,即E[||x-x||2]最小,
原创力文档


文档评论(0)