- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分类技术前沿问题—人脸识别 - 知识管理与数据分析实验室
* 知识管理与数据分析实验室 * 附录 最新前沿性工作介绍(电子版) 《基于LLE和BP神经网络的人脸识别》 运用该方法的管理学博士硕士论文(代表性) 《数据挖掘技术中分类算法的比较分析》 * 知识管理与数据分析实验室 * 谢谢! 知识管理与数据分析实验室 知识管理与数据分析实验室 分类技术概论及前沿问题 * * 知识管理与数据分析实验室 主要内容 * 知识管理与数据分析实验室 * 数据分类技术概况 1 数据分类方法介绍 2 各种方法比较评述 3 分类技术前沿问题—人脸识别 4 数据分类的简含义 我们都曾经有这样的经验,在人流攒动的电影院门口等待相约而至的朋友,通过找寻与识别,能够在人群中一下子发现熟悉的脸,其实这个过程就是一个数据分类的过程。 相较于要发现的知识完全未知的无监督学习,数据分类是一种典型的有监督的机器学习方法,目的是从一组已知类别的数据中发现分类模型,以预测新数据的未知类别。 * 知识管理与数据分析实验室 * * 知识管理与数据分析实验室 * 用刚才我们提到的寻找朋友的过程举例,首先从自己熟知的朋友身上提取特点,比如脸型、身材、穿着等,这就形成了一个简单的分类模型。 然后在电影院门前对每一个发现的陌生人进行判断,“是朋友”或者“不是朋友”,从而对新数据进行了预测。 √ x x 分类技术的应用 * 知识管理与数据分析实验室 * 信用卡审批 科学研究 银行 医疗 商业 图形处理 有效性分析 故障检测 医疗诊断 目标市场定位 工业 ● ● ● 数据分类技术 数据分类的过程 * 知识管理与数据分析实验室 * 一个完整的数据分类过程一般包括模型构造、模型测试和模型应用三个步骤,具体来说,我们可以将数据分成两个数据集,分别是训练集和测试集,用于模型构造和模型测试。整体的步骤说明如下。 * 知识管理与数据分析实验室 * 1 模型构造 在这个阶段,分析样本的类别和其具备的一些特征之间的依赖关系,并将这种关系用特定的模型表示出来。 2 模型测试 测试的过程是对测试数据依次进行检测,根据模型确定样本的类别,与实际类别相比较,相同即是结果正确。 3 模型应用 这个过程与模型测试基本相同,只是输入的数据是未知的,例如,在电影院门口观察陌生人,在其中寻找朋友。 数据分类的过程详解 * 知识管理与数据分析实验室 * 数据分类方法介绍 2 数据分类方法介绍 1 各种方法评述 3 分类技术前沿问题—人脸识别 4 数据分类方法介绍 现在我们使用的分类方法中比较常用的有决策树方法、神经网络方法、遗传算法、支持向量机,除此以外还有粗糙集理论以及贝叶斯分类等方法,上图详细列出了现阶段正在使用的各种分类方法,下面将对重要方法进行介绍。 * 知识管理与数据分析实验室 * * 知识管理与数据分析实验室 * 决策树分类法 所谓“决策树”,顾名思义,它具有树状结构,根据层次的不同,节点分为根节点、内部节点和叶节点三类,每个节点对应一个样本集,根节点作为“树根”,对应的是整个样本集,内部节点类似于树干枝杈,对应样本子集,叶节点就相当于树叶了,对应一个类标志。根节点和内部节点含有一个对于样本属性的测试,根据测试的结果将样本集划分为两个或者多个子集,每个子集形成一个分支,由叶节点内的类标志来标识,就像树不断分散的枝杈茎叶一样,如右图所示。 我们用制造厂商经常使用会员分类案例来进一步说明决策树的使用方法,在分类模型中,以年龄作为属性,根节点对应的是整个样本集即所有参与某自行车厂商调查的顾客,内部节点对应样本子集,比如年龄在67岁以上的顾客群体。根节点和内部节点含有一个对于样本属性的测试,即对年龄加以限制的测试。 使用1000个会员事例训练模型后得到的决策树分类如下: * 知识管理与数据分析实验室 * 图中矩形表示一个拆分节点,矩形中文字是拆分条件。矩形颜色深浅代表此节点包含事例的数量,颜色越深包含的事例越多,如全部节点包含所有的1000个事例,颜色最深。 节点中的条包含两种颜色,红色和蓝色,分别表示此节点中的事例购买和不购买自行车的比例。这样一来,便可以通过条件得出在哪个年龄段的哪些地区的人,最容易购买自行车,至此建立了模型。 随后可以从新导入一批已知数据进行模型测试,完成这个步骤,如果模型可用,便将其他的会员在分类模型中查找就可预测会员购买自行车的概率有多大,随后自行车厂商就可以有选择性的投递广告册。 神经网络分类法 人类的大脑有近1000亿个神经元和十倍于此的神经胶质细胞。神经网络是一种具有若干连续处理结点的并行计算系统,它建立了一种数学模型,试图去模仿人类的大脑。 神经网络将每一个连接看作一个处理单元,这些处理单元结点通常称作神经元,来表明脑神经之间的关系。 * 知
您可能关注的文档
- 关于园区绿化提升邀标文件 - 厦门软件园.doc
- 关于在全市党员中开展学党章党规学系列讲话做合格党员学习教育 .doc
- 关于在我院引入校企合作项目——汽车驾驶培训的补充 - 厦门技师学院.doc
- 关于在集团公司党员中开展 - 汕头市建安(集团)公司.doc
- 关于广州市节能产品惠民工程推广信息 - 广州市能源学会门户网站.doc
- 关于对考取研究生的2011届本科毕业生 - 知行学院学院办 - 湖北大学 .doc
- 关于开展2017年全市“共青团员先锋岗(队)” - 鹰潭市共青团.doc
- 关于开展为保障性住房建设供应达标建筑材料活动的通知.doc
- 关于开展医院消毒供应室达标创建活动的通知 - 淮安市卫生和计划生育 .doc
- 关于开展温州医学院兼职教师聘任工作的通知 - 温州市中医院.doc
- 2025年重庆信息技术职业学院单招(语文)测试模拟题库附答案.docx
- 2025年重庆市凉山彝族自治州行政职业能力测验模拟试题附答案.docx
- 2025年重庆市资阳地区行政职业能力测验题库及答案1套.docx
- 2025年重庆市巴中地区单招语文测试题库及答案一套.docx
- 2025年重庆工信职业学院单招语文测试题库及参考答案.docx
- 2025年重庆市内江市行政职业能力测验题库审定版.docx
- 2025年重庆城市科技学院单招语文测试模拟题库审定版.docx
- 2025至2030化妆品香精行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030工业土豆煎锅行业产业运行态势及投资规划深度研究报告.docx
- 2025至2030中国艾滋病药物行业产业运行态势及投资规划深度研究报告.docx
最近下载
- 2025湖北武汉市汉阳区招聘社区干事40人备考试题及答案解析.docx VIP
- 新能源汽车试题库(附答案).docx VIP
- 《碳纤维片材加固混凝土结构技术规程》(2022年版).pdf VIP
- 2023年地面及屋面分布式光伏发电工程HSE作业指导书(最终版).docx VIP
- 常用塑料特性及塑料成型工艺.pdf VIP
- 甲烷安全技术说明书MSDS.pdf VIP
- 统编版语文四年级上册第五单元素养评估(含答案).docx VIP
- 入党志愿书电子版模板(空白) .doc VIP
- 五年级下册生字练字帖硬笔书法.pdf VIP
- 《国有企业管理人员处分条例》考试题库200题(含答案).docx VIP
文档评论(0)