- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别
一、课程简介
模式识别包含了模式识别与数据挖掘两门课程。模式识别与数据挖掘研究的内容是使机器能
做以前只能由人类才能做的事,具备人所具有的、对各种事物与现象进行分析、描述与判断、并
在大型数据库中发现模式的能力。模式识别与数据挖掘是在统计分析、语言学、计算机科学、生
物学、控制论、优化算法等技术的基础上发现潜在有价值的模式,解决生物医学基础科研中的实
际问题。
通过本课程的学习,使学生了解和掌握模式识别与数据挖掘的基础理论、基本知识,掌握模
式识别与数据挖掘的常用技术和方法,掌握以计算机为工具对生物数据进行储存、检索和分析的
科学、有效地进行数据的采集、整理、检索、分析,从中提取有价值的模式,同时培养学生应用
所学知识解决生物学问题的能力,为学生在未来工作中合理使用模式识别与数据挖掘方法打下坚实
的理论基础。
二、理论教学内容
1.模式识别总论
了解内容:模式识别和模式的概念;模式识别系统。
2. 贝叶斯决策理论
掌握内容:贝叶斯决策理论基本概念;常用的决策规则,包括:最小错误率贝叶斯决策,基
于最小风险的贝叶斯决策,朴素贝叶斯分类器;正态分布时的统计决策;关于分类时的统计决策;判
别函数和决策面;贝叶斯决策方法生物学应用。
了解内容:正态分布概率密度的定义和性质;决策规则的不同形式;决策的错误率;最小风
险决策的一般性;多元正态概率模型下的最小错误率贝叶斯决策;贝叶斯决策应用。
了解内容:最大似然估计,多元正态分布参数最大似然估计。
3. 线性分类器
掌握内容:Fisher线性判别;感知准则函数;最小错分样本数准则;多类问题。
了解内容:最小平方误差准则函数;随机最小错误率线性判别准则函数。
4. 非线性分类器
掌握内容:分段线性判别函数、多层感知器神经网络、支持向量机。
5. 其他分类器
了解内容:最近邻法;k-近邻法。
6. 决策树分类算法
掌握内容:决策树归纳;决策树的工作原理;决策树归纳算法;评估分类器的性能;比较分
类器的方法;不平衡类问题;决策树生物学应用。
了解内容:模型的过分拟合;组合方法;随机森林;随机森林生物学应用。
7. 聚类分析及应用
掌握内容:数据、簇和聚类算法的特性;基于原型的聚类;基于密度的聚类;基于图的聚类、
聚类应用。
了解内容:可伸缩的聚类算法。
8. 关联分析及应用
掌握内容:频繁项集的产生;规则产生;频繁项集的紧凑表示;处理分类属性连续属性;序
列模式;子图模式;挖掘多物种通路频繁模式;文本挖掘。
了解内容:产生频繁项集的其他方法;FP增长算法;关联模式的评估;倾斜支持度分布的
影响;非频繁模式。
70
三、实验教学内容
1.基于Fisher准则的线性分类器设计
基本内容:本实验旨在让同学进一步了解分类器的设计概念,能够根据自己的设计对线性分类器
有更深刻地认识,理解Fisher准则方法确定最佳线性分界面方法的原理。完成Fisher线性分类器的设
计。利用试验数据集合训练两个具体的Fisher分类器,一个利用二维数据 (即前两列属性)构建分
类器,另一个利用三维数据构建分类器。分析W 的比例因子对于Fisher判别函数没有影响的原因。
基本要求:了解分类器的设计概念;能够自己的设计对线性分类器,理解Fisher准则方法确
定最佳线性分界面方法的原理。
2. 利用模式识别软件进行分类器设计
基本内容:安装模式识别软件 (WEKA ),对软件数据格式、数据准备、分类部分进行学习,并
根据实例操作,了解weka 的主要功能;选择朴素贝叶斯分类方法,进行分类器的整体设计和检验。
基本要求:掌握weka 的分类模块中分类方法,例如:贝叶斯方法,Fisher方法;熟悉交叉验
证方法;特征选择方法。
3. 决策树归纳设计
基本内容:实现决策树归纳算法;评估分类器的性能;ROC 曲线的绘制,生物数据的应用。
基本要求:掌握决策树的工作原理;熟悉评估分类器的性能的方法。
4. 聚类分析
基本内容:利用k均值和层次聚类分析结肠癌基因表达谱数据,对样本和基因进行聚类,分
析聚类的结果;结合生物学背景,解释结果的生物学含义;利用SNN测度
您可能关注的文档
- 《APP制作技术》教学大纲(本科).pdf
- 《Cytoscape软件应用》教学大纲(本科).pdf
- 《C语言程序设计》教学大纲(本科).pdf
- 《JAVA语言程序设计》教学大纲(本科).pdf
- 《JSP编程与网站开发》教学大纲(本科).pdf
- 《Linux与shell编程》教学大纲(本科).pdf
- 《Matlab语言程序设计》教学大纲(本科).pdf
- 《Perl语言程序设计》教学大纲(本科).pdf
- 《Python语言程序设计》教学大纲(本科).pdf
- 《R语言程序设计》教学大纲(本科).pdf
- 山东省聊城市高唐县2024-2025学年九年级上学期第一次月考语文试题(解析版).docx
- 辽宁省沈阳市郊联体2024-2025学年高三上学期11月期中地理试题.docx
- 宁夏回族自治区石嘴山市第一中学2024-2025学年高二上学期11月期中英语试题.docx
- 甘肃省多校2024-2025学年高一上学期期中联考历史试题(解析版).docx
- 海南省海口市琼山区海南中学2024-2025学年高二上学期11月期中考试地理试题(解析版).docx
- 四川省雅安中学2024-2025学年高二上学期11月期中生物试卷.docx
- 浙江省金华市十校2024-2025学年高三上学期11月模拟考试历史试题(解析版).docx
- 浙江省衢州五校联盟2024-2025学年高二上学期期中联考历史试卷.docx
- 福建省漳州市第一中学2024-2025学年高三上学期期中化学试卷.docx
- 江西省上饶市蓝天教育集团2024-2025学年高一上学期期中考试物理试题(解析版).docx
文档评论(0)