- 3
- 0
- 约6.7万字
- 约 10页
- 2025-10-21 发布于江西
- 举报
JournalofComputerApplicationsISSN1001‐90812024‐11‐10
计算机应用,2024,44(11):3449-3458CODENJYIIDUhttp://www.joca.cn
文章编号:1001-9081(2024)11-3449-10DOI:10.11772/j.issn.1001-9081.2024030398
基于基因关联分析的贝叶斯网络疾病样本分类算法
11*23
李志杰,廖旭红,李元香,李青蓝
(1.湖南理工学院信息科学与工程学院,湖南岳阳414006;2.武汉大学计算机学院,武汉430072;
3.宾夕法尼亚大学医学院,美国宾夕法尼亚费城19019)
(∗通信作者电子邮箱lxh2402163.com)
摘要:基因表达数据作为生物学中一种特定类型的大数据,尽管基因表达值都是普通的实数值,但它们的相似
性不是基于欧氏距离度量,而是基于基因表达值是否展现同升同降趋势。目前的基因贝叶斯网络以基因表达水平值
为节点随机变量,没有体现这种子空间模式的相似性。因此,提出基于基因关联分析的贝叶斯网络疾病分类算法
(BCGA),从带类标签的疾病样本-基因表达数据中学习贝叶斯网络并预测新疾病样本的分类。首先,将疾病样本离
散化过滤以选择基因,并将降维后的基因表达值排序和置换为基因列下标;其次,分解基因列下标序列为长度为2的
原子序列集合,而这个集合的频繁原子序列对应一对基因的关联关系;最后,通过基因关联熵度量因果关系,并用于
贝叶斯网络结构学习。BCGA的参数学习也变得很容易,基因节点的条件概率分布只要统计该基因的原子序列和父
节点基因的原子序列出现频次即可。在多个肿瘤和非肿瘤基因表达数据集上的实验结果表明,相较于已有的同类算
法,BCGA的疾病分类准确率明显提高,分析时间有效缩短;另外,BCGA使用基因关联熵代替条件独立性,使用基因
原子序列代替基因表达值,可以更好地拟合基因表达数据。
关键词:基因表达数据;频繁原子序列;基因关联熵;基因序列贝叶斯网络;疾病分类
中图分类号:TP181文献标志码:A
DiseasesampleclassificationalgorithmbyBayesiannetworkwithgeneassociationanalysis
11*23
LIZhijie,LIAOXuhong,LIYuanxiang,LIQinglan
(1.SchoolofInformationScienceandEngineering,HunanInstituteofScienceandTechnology,YueyangHunan414006,China;
2.SchoolofComputerScience,W
您可能关注的文档
- 基于酶活力模型和细胞模型分析红毛藻多糖降血脂活性.pdf
- 克林霉素原位富集土壤微生物群落多样性及抗菌活性分析.pdf
- 火力发电厂一机双塔运行改造经济性分析.pdf
- 某火力发电厂非同期并网事故跳闸分析.pdf
- 面向高性能计算的互连网络拥塞控制分析与评估.pdf
- 基于PMC指数模型的中医医保支付方式改革政策文本分析.pdf
- 年代剧中现实主义美学运用分析.pdf
- 烟草根腐病生防菌的筛选鉴定及抑菌活性分析.pdf
- 响应面法优化艾蒿多糖的提取工艺及其组成成分和体外抗氧化活性分析.pdf
- 基于样本弱依赖多项式混沌展开式的电网小干扰概率分析.pdf
- 03-2 2025年度民主生活会征求意见座谈会主持词.docx
- 03-1 2025年度民主生活会主持讲话提纲.docx
- 02-1 会前学习-《县以上党和国家机关党员领导干部民主生活会若干规定》相关要求.docx
- 在2025年度民主生活会上的总结讲话三篇.docx
- 在2025年度民主生活会上的总结讲话三篇 (3).docx
- 市委宣传部2025年度民主生活会查摆问题整改方案两篇.docx
- 在市行政审批和政务信息管理局机关2026年全体干部政绩观教育大会上的党课讲稿.docx
- X市应急管理局2026年度安全生产监督检查计划.docx
- 2025年度民主生活会领导班子对照检查材料(五个带头)三篇.docx
- 2025年度民主生活会“五个带头”个人对照检查材料三篇.docx
原创力文档

文档评论(0)