基于滤波理论和特征统计的蛋白质编码区预测算法分析-analysis of protein coding region prediction algorithm based on filtering theory and feature statistics.docx
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于滤波理论和特征统计的蛋白质编码区预测算法分析-analysis of protein coding region prediction algorithm based on filtering theory and feature statistics
中文摘要真核生物的DNA序列结构较原核生物更加复杂,因此尽管在过去几十年间种类繁多的基因预测算法有了很大的发展和进步,并且持续受到关注,但迄今为止,在蛋白质编码区(外显子,特别是短外显子)的预测准确率仍然不能满足对DNA片段或基因组序列进行标注的需求。本文分别对以滤波器、假设检验和Fisher判别分析为核心的编码区预测算法进行研究,以提高预测准确率。以下列出本文的主要创新点。首先从对SDFT的研究出发,提出了多滑动窗周期图编码区预测算法。该算法结合了长窗选频特性好和短窗时域定位能力强的优点,对与滑动窗长度相关的频谱分辨力与时域分辨力相矛盾的问题,给出了一个较好的折中方案。其次,研究了使用线性相位FIR和IIR窄通带滤波器作为核心的预测算法,提出了窄通带滤波器NPBF(NarrowPass-BandFilter)编码区预测算法。对频率采样、窗函数和全相位三种FIR窄通带滤波器在编码区预测中面临的问题,如滤波器输入输出序列长度不等、群延迟和功率谱密度曲线不平滑等分别提出了改进的方法。其中,全相位窄通带滤波器是全相位理论在基因预测研究中的首次应用。在对线性相位IIR窄通带滤波器的设计与应用研究中,将从FIR滤波器设计和应用中得来的NPBF预测算法推广,使之也适用于线性相位IIR窄通带滤波器。对IIR窄通带滤波器系统由于累积误差的存在而造成的预测系统的不稳定,从滤波器设计参数选择方面加以改善。为了提高算法对编码区的敏感性,还提出了双阈值编码区识别算法。第三,在NPBF预测算法的基础上研究了映射方法与预测准确率的关系。针对众多研究人员提出或采用不同映射方法获得了较高的预测准确率的结论,用NPBF算法对当前的十多种DNA序列的映射方法与预测结果的关系作了研究。在HMR195和ALLSEQ两个数据集上的实验结果表明,Voss法和Z曲线法同为最优选择,为选用映射方法提供依据。第四,研究了新近提出的基于T检验和Z检验的TZT编码区预测算法,对该算法的适用范围进行了研究。研究结果发现,TZT算法对编码区较长而非编码区较短的序列能够以较高的准确率区分出编码区和非编码区,但对编码区较短而非编码区较长的序列则效果欠佳。对TZT算法进行完善是一个很有价值的研究课题。最后,基于Z曲线DNA序列特征参数,研究了用Fisher判别分析对编码序列和非编码序列进行分类。在用Fisher判别分析研究分类问题时,分类阈值一般有5种不同的选取方法,论文在选定的测试训练集上采用七重交叉验证的实验方法对不同阈值获得的预测分类结果做了研究和分析,给出了适用于编码DNA序列预测分类的Fisher判决分析阈值选择方案。本文的工作提高了独立预测预测算法对编码区预测的准确率,为解决实际应用中的问题提供了有参考价值的研究成果和方案。关键词:蛋白质编码区预测;多滑动窗周期图;线性相位窄通带滤波器;全相位滤波器;映射方法;TZT预测算法;费舍尔判别分析ABSTRACTThedeoxyribonucleicacid(DNA)structureofeukaryoticismuchmorecomplicatedthanthatoftheprokaryotic.Inthepastdecades,theaccuracyofproteincodingregions(exons)predictionisfarfromsatisfactionfortheneedsofannotationofanewlysequencedDNAsequenceorgenome.Inthisthesis,theproteincodingregionspredictionalgorithmstakingthedigitalfilters,thetestofstatisticalsignificanceandtheFisherdiscriminantanalysis(FDA)respectivelyasthekernelhavebeenexploredandstudiedforimprovingtheaccuracy.Themaincontributionsarelistedasfollows:First,startingfromthestudyoftheslidingdiscreteFouriertransform(SDFT),themulti-sliding-windowperiodogram(MSWP)basedproteincodingregionspredictionalgorithmisproposed.ThelongertheSDFTwindowthebetterthetripletbasesperiodicial(TBP)signalisextracted,whiletheshortertheSDFTwindow
您可能关注的文档
- 基于流形分析的潜油电机温度辨识及过热保护分析-temperature identification and overheating protection analysis of submersible motor based on manifold analysis.docx
- 基于流固耦合的水润滑橡胶轴承润滑特性分析-analysis of lubrication characteristics of water-lubricated rubber bearings based on fluid-solid coupling.docx
- 基于流形学习的金属断口图像识别方法分析-analysis of metal fracture image recognition method based on manifold learning.docx
- 基于流形学习算法和支持向量机的矿井瓦斯涌出量预测分析-prediction and analysis of mine gas emission based on manifold learning algorithm and support vector machine.docx
- 基于流计算模型的视频编码关键技术分析-analysis of key technologies of video coding based on stream computing model.docx
- 基于六西格玛的高强度汽车大梁钢质量改进分析-quality improvement analysis of high strength automobile girder steel based on six sigma.docx
- 基于流形学习和稀疏表示的高光谱遥感影像分类分析-classification and analysis of hyperspectral remote sensing images based on manifold learning and sparse representation.docx
- 基于六氯环三磷腈的1,3,4-噁二唑类电子传输材料的合成与性能研究-synthesis and properties of 1,3,4 - oxadiazole electron transport materials based on hexachlorocyclotriphosphazene.docx
- 基于六西格玛管理的国有企业绩效管理改进分析——以z公司为例-analysis of performance management improvement of state - owned enterprises based on six sigma management - taking z company as an example.docx
- 基于流体动力润滑理论的深孔加工直线度误差分析分析-analysis of straightness error in deep hole machining based on hydrodynamic lubrication theory.docx
- 基于慢正电子束流技术制备sio 2薄膜的应用-application of sio _ 2 thin films prepared by slow positron beam current technology.docx
- 基于猫群算法的多目标混流装配线重排序问题分析-analysis of multi-objective mixed-flow assembly line reordering problem based on cat group algorithm.docx
- 基于慢生活观念的茶馆家具设计研究——以杭州茶馆为例-study on teahouse furniture design based on the concept of slow life - taking hangzhou teahouse as an example.docx
- 基于锚杆传力性能的铁底板锚固设计分析-design and analysis of iron floor anchorage based on bolt force transmission performance.docx
- 基于满意度的人居环境宜居性评价——以兰州市为例-evaluation of livability of human settlements based on satisfaction —— a case study of lanzhou city.docx
- 基于猫群算法的无线传感器网络路由优化算法分析-analysis of routing optimization algorithm for wireless sensor networks based on cat group algorithm.docx
- 基于慢正电子束流技术制备sio,2薄膜的应用-application of sio _ 2 thin films prepared by slow positron beam current technology.docx
- 基于媒体感知arq的无线视频流qos保障分析-qos guarantee analysis of wireless video stream based on media aware arq.docx
- 基于锚节点的无线传感器网络定位技术分析-analysis of localization technology in wireless sensor network based on anchor node.docx
- 基于煤化工行业的供应链绩效评价分析-analysis of supply chain performance evaluation based on coal chemical industry.docx
文档评论(0)