- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于位置信息的非比对序列聚类方法-计算机应用与软件
第34卷第12期 计算机应用与软件 Vol34No.12
2017年12月 ComputerApplicationsandSoftware Dec.2017
基于位置信息的非比对序列聚类方法
魏 静 徐彭娜 江育娥 林 稢
(福建师范大学软件学院 福建福州350108)
摘 要 非比对序列相似性模型直接采用序列自身的统计信息来计算序列之间的相似度,具有运算速度快、聚
类结果准确等优点。提出一种基于位置信息的非比对序列相似性模型,通过提取K词模型中每个词的LocalFre
quency(LF),计算对应K词的LF熵,并结合K词频率进行序列的特征提取,应用于蛋白质聚类。实验结果表明
该方法能够有效地提取序列的信息,提高聚类的准确率。
关键词 K词 LF熵 Kmeans聚类 位置信息
中图分类号 TP3 文献标识码 A DOI:10.3969/j.issn.1000386x.2017.12.008
ALIGNMENTFREEMODELFORSEQUENCECLUSTERINGMETHODBASED
ONLOCATIONINFORMATION
WeiJing XuPengna JiangYu’e LinJie
(FacultyofSoftware,FujianNormalUniversity,Fuzhou350108,Fujian,China)
Abstract Alignmentfreesimilaritymodelforsequencecalculatesthesimilaritybetweenthesequencesbyusingthe
statisticalinformationofthesequences,whichhastheadvantageoffastcalculationandhighprecision.Alignmentfree
modelforsequenceclusteringmethodbasedonpositioninformationwasproposed.Thefeaturesofsequencescanbe
obtainedbycombiningtheLFentropyofthecorrespondingwordwhichwascalculatedfromtheLocalFrequencyofevery
wordwiththeKmersmodel,andthefrequencyofeveryword.Thisnewmethodcanbeappliedtoproteinclustering.
Theexperimentalresultsshowedthisnewmethodimprovedtheaccuracyofclusteringeffectively.
Keywords Kmers Localfrequencyentropy Sequenceclustering Positioninformation
这两类算法,他们均是基于识别“比对种子”的启发式
0 引 言 算法,并得到广泛的应用。非比对法包含有图形表示
法、概率统计方法、K词的方法、文本压缩方法以及信
在生物信息研究领域中,序列的特征提取和相似 息理论方法等。Dai等[3]在序列比较的非比对法研究
性检测是十分重要的,对大量的生物序列进行聚类分 中,通过集成生物序列中字的重叠结构和背景信息,提
析是生物数据挖掘的研究方向之一,其应用前景十分 出了一种新的统计方法。BonhamCarter等[4]等在文
广泛。近年来,快速发展的生物科学技术使得生物信
您可能关注的文档
- 匿名讨论区档案-成功大学数位学习平台.PDF
- 十九世纪西方的宪政思想.DOC
- 千亿国际热搜词可以根据热搜词指数选出适合自己店铺今日热搜词.DOC
- 千年古镇美丽的朱家角.PPT
- 华亚贸易公司信用证拒付案-广州商学院在线课程.DOC
- 华为赛门铁克.PPT
- 华南理工大学教学科研岗位聘任申报表-华南理工大学图书馆.DOC
- 协议模板-精融汇.PDF
- 单位网上业务系统-杭州公积金.DOC
- 南京地铁站名的社会语言学分析-中国社会科学网.PDF
- 基于以太网的嵌入式数据采集系统的研究与应用-计算机系统应用.PDF
- 基于免疫克隆算法的多目标聚类方法-信息与控制.PDF
- 基于光纤以太网通信的大功率工业整流系统多点测量与-电工技术学报.PDF
- 基于全成分免煎中药的处方自动调配系统-计算机系统应用.PDF
- 基于修正模态应变能指标的板结构损伤定位1.PDF
- 基于关系数据库的地籍空间数据存储结构-武汉大学学报·信息科学版.PDF
- 基于共词分析的医学伦理学领域主题热点及演进态势-中科院成都文献.PDF
- 基于决策树技术分析动态图形数据的研究与实现-福州大学学报.PDF
- 基于区域加权的视频质量评价方法-宁波大学学报理工版.PDF
- 基于半边图模型的蛋白质建模研究-计算机工程与应用.PDF
最近下载
- 第1课 家居清洁与整理技巧 课件 2023—2024学年苏教版初中劳动技术八年级下册.pptx VIP
- 黑龙江哈尔滨师范大学附属中学2024-2025学年高一上学期期末考试政治试题 含解析.docx VIP
- T_WSJD 18.14—2021_工作场所空气中化学因素测定煤焦油沥青挥发物、焦炉逸散物中苯溶物的称重法.pdf VIP
- 人教版七年级上册英语字帖.pdf VIP
- 湘2017J907 居住建筑节能65%围护结构构造图集.pdf
- 交通局交通安全培训.pptx VIP
- 西南财经大学答辩通用PPT模板.pptx VIP
- 2025年最新人教版八年级(初二)数学上册教学计划及进度表(新课标,新教材).docx
- 《近代文学》教学大纲.pdf VIP
- 2024美妆行业数字化转型白皮书.pdf VIP
文档评论(0)