- 4
- 0
- 约1.15万字
- 约 6页
- 2017-12-29 发布于广东
- 举报
基于阶乘矩及时间序列方法识别人类基因编码区膏
高婷婷 彭志红 陈杰 刘毅
(北京理工大学,自动控制系,北京100081)
gttel23@sina.corn
三种长度外显子为对象,运用阶乘矩和时间序列方法将生物位点特征、统计特征相结合,在
较高精度上识别外显子特别是较长和较短的外显子。通过使外显子与内含子差异最大的
子序列的阶乘矩,突显外显子和内含子统计特性差别。再采用时间序列Time-Delay
embedding方法将得到的数据展开成二维空间,进一步突出统计特性差异,并在第三维空间
加入生物位点特征。最后用贪婪算法进行聚类,得到短外显子sn为0.70,平均长度外显子
Sn为0.92,长外显子sn为0.78。本项目研究结果在保证一般长度外显子识别精度的同时
解决目前对较长及较短外显子识别精度普遍低下的问题,有较高的精度和较强的学习能力。
关键词:编码区外显子阶乘矩时间序列k=tuple特征量
and
FactorialiMomentbased
Time-DelayEmbedding
。Human.Genome Identification*
CodingRegion
Crao Yi
Iie,Lin
Tingting,PengZhihong.Chen
ofInformationScienceand
College Technology,
Institute China
Beijing ofTechnology,B;eijing,100081,P.R
86—010-6891246911gttdl23@sina.com‘
on new Factorial
Abstract:Basedstatisfical
patternrecognition,aalgoiithm,whichemploys
functionalsitesandexonsforhuman
Moment@峋andTime-Delayembedding.forrecognizing
isintroduced:FirStof is tODNA tO、‘obfionFMfeature
genome all,--k-tupleapplied sequence
variant.Then.threekindsof and forFMinordertOfmd
windOws,50bp,lOObp200bp,are,chosen
short(50bp),middle(aroundlOObp)and
dismissesthe results introducesthethird
Time·Delay fuzzy broughtby‘FM,and
embcdding
adds searchisthen tOsearch
dimension,which
biologioalcharacters.Finally,G
您可能关注的文档
最近下载
- 手术室护士的职业暴露与防护课件.pptx VIP
- 机械工程测试技术基础的期末考题及答案.docx VIP
- 药店医疗器械质量管理制度.docx VIP
- 高二物理电场综合测试练习试卷及答案.doc VIP
- (2023春)大象版六年级科学下册全册教案(教学设计).doc
- 社区获得性肺炎重症的护理查房.pptx VIP
- 高考物理复习《带电粒子在电场中的力电综合问题》强化练习含答案.pdf VIP
- 广告牌安装安全协议书范本(标准版).doc VIP
- 湖北省武汉市东湖新技术开发区 2024-2025学年七年级上学期期末道德与法治试卷.docx VIP
- 宝胜电缆中英文对照样本Product-Catalogue.pdf VIP
原创力文档

文档评论(0)