- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 知识管理与数据分析实验室 * 附录 最新前沿性工作介绍(电子版) 《基于LLE和BP神经网络的人脸识别》 运用该方法的管理学博士硕士论文(代表性) 《数据挖掘技术中分类算法的比较分析》 * 知识管理与数据分析实验室 * 谢谢! 知识管理与数据分析实验室 知识管理与数据分析实验室 分类技术概论及前沿问题 * * 知识管理与数据分析实验室 主要内容 * 知识管理与数据分析实验室 * 数据分类技术概况 1 数据分类方法介绍 2 各种方法比较评述 3 分类技术前沿问题—人脸识别 4 数据分类的简含义 我们都曾经有这样的经验,在人流攒动的电影院门口等待相约而至的朋友,通过找寻与识别,能够在人群中一下子发现熟悉的脸,其实这个过程就是一个数据分类的过程。 相较于要发现的知识完全未知的无监督学习,数据分类是一种典型的有监督的机器学习方法,目的是从一组已知类别的数据中发现分类模型,以预测新数据的未知类别。 * 知识管理与数据分析实验室 * * 知识管理与数据分析实验室 * 用刚才我们提到的寻找朋友的过程举例,首先从自己熟知的朋友身上提取特点,比如脸型、身材、穿着等,这就形成了一个简单的分类模型。 然后在电影院门前对每一个发现的陌生人进行判断,“是朋友”或者“不是朋友”,从而对新数据进行了预测。 √ x x 分类技术的应用 * 知识管理与数据分析实验室 * 信用卡审批 科学研究 银行 医疗 商业 图形处理 有效性分析 故障检测 医疗诊断 目标市场定位 工业 ● ● ● 数据分类技术 数据分类的过程 * 知识管理与数据分析实验室 * 一个完整的数据分类过程一般包括模型构造、模型测试和模型应用三个步骤,具体来说,我们可以将数据分成两个数据集,分别是训练集和测试集,用于模型构造和模型测试。整体的步骤说明如下。 * 知识管理与数据分析实验室 * 1 模型构造 在这个阶段,分析样本的类别和其具备的一些特征之间的依赖关系,并将这种关系用特定的模型表示出来。 2 模型测试 测试的过程是对测试数据依次进行检测,根据模型确定样本的类别,与实际类别相比较,相同即是结果正确。 3 模型应用 这个过程与模型测试基本相同,只是输入的数据是未知的,例如,在电影院门口观察陌生人,在其中寻找朋友。 数据分类的过程详解 * 知识管理与数据分析实验室 * 数据分类方法介绍 2 数据分类方法介绍 1 各种方法评述 3 分类技术前沿问题—人脸识别 4 数据分类方法介绍 现在我们使用的分类方法中比较常用的有决策树方法、神经网络方法、遗传算法、支持向量机,除此以外还有粗糙集理论以及贝叶斯分类等方法,上图详细列出了现阶段正在使用的各种分类方法,下面将对重要方法进行介绍。 * 知识管理与数据分析实验室 * * 知识管理与数据分析实验室 * 决策树分类法 所谓“决策树”,顾名思义,它具有树状结构,根据层次的不同,节点分为根节点、内部节点和叶节点三类,每个节点对应一个样本集,根节点作为“树根”,对应的是整个样本集,内部节点类似于树干枝杈,对应样本子集,叶节点就相当于树叶了,对应一个类标志。根节点和内部节点含有一个对于样本属性的测试,根据测试的结果将样本集划分为两个或者多个子集,每个子集形成一个分支,由叶节点内的类标志来标识,就像树不断分散的枝杈茎叶一样,如右图所示。 我们用制造厂商经常使用会员分类案例来进一步说明决策树的使用方法,在分类模型中,以年龄作为属性,根节点对应的是整个样本集即所有参与某自行车厂商调查的顾客,内部节点对应样本子集,比如年龄在67岁以上的顾客群体。根节点和内部节点含有一个对于样本属性的测试,即对年龄加以限制的测试。 使用1000个会员事例训练模型后得到的决策树分类如下: * 知识管理与数据分析实验室 * 图中矩形表示一个拆分节点,矩形中文字是拆分条件。矩形颜色深浅代表此节点包含事例的数量,颜色越深包含的事例越多,如全部节点包含所有的1000个事例,颜色最深。 节点中的条包含两种颜色,红色和蓝色,分别表示此节点中的事例购买和不购买自行车的比例。这样一来,便可以通过条件得出在哪个年龄段的哪些地区的人,最容易购买自行车,至此建立了模型。 随后可以从新导入一批已知数据进行模型测试,完成这个步骤,如果模型可用,便将其他的会员在分类模型中查找就可预测会员购买自行车的概率有多大,随后自行车厂商就可以有选择性的投递广告册。 神经网络分类法 人类的大脑有近1000亿个神经元和十倍于此的神经胶质细胞。神经网络是一种具有若干连续处理结点的并行计算系统,它建立了一种数学模型,试图去模仿人类的大脑。 神经网络将每一个连接看作一个处理单元,这些处理单元结点通常称作神经元,来表明脑神经之间的关系。 * 知
您可能关注的文档
- 低压配电接地型式.ppt
- 住宅小区分户验收交房标准实例(户内、公共、水电)概要.ppt
- 体育产业概论总复习.doc
- 住院患者非计划性拔管护理管理方案全解.ppt
- 体检中心质量管理89274.ppt
- 体检报告解读分析.doc
- 体育室内课:1、交通标志2、击鼓传花.ppt
- 会议室方案设计模板.ppt
- 余姚关工委暑期教育活动集锦十九.doc
- 余世维——突破人才经营瓶颈ppt.ppt
- 广东省东莞市2024-2025学年八年级上学期生物期中试题(解析版).pdf
- 非遗剪纸文创产品开发经理岗位招聘考试试卷及答案.doc
- 广东省东莞市2024-2025学年高二上学期期末教学质量检查数学试题.pdf
- 体育安全理论课件图片素材.ppt
- 3.1 公民基本权利 课件-2025-2026学年道德与法治八年级下册 统编版 .pptx
- 广东省潮州市湘桥区城南实验中学等校2024-2025学年八年级上学期期中地理试题(解析版).pdf
- 大数据运维工程师岗位招聘考试试卷及答案.doc
- 广东省深圳市福田区八校2026届数学八年级第一学期期末教学质量检测模拟试题含解析.doc
- 广东省潮州市湘桥区城基初级中学2024-2025学年八年级上学期11月期中考试数学试题(解析版).pdf
- 广东省潮州市湘桥区城西中学2024-2025学年八年级上学期期中地理试题(解析版).pdf
最近下载
- 木糖醇研究预测报告_木糖醇项目商业计划书(2024-2028年).pptx VIP
- 卡特挖掘机电路图(中文).pdf VIP
- 一种冷凝水回收装置、控制方法和空调器.pdf VIP
- 2025网课智慧树知道《自动控制原理仿真实验课程(山东大学)》章节测试答案.docx VIP
- 灯具销售培训课件.ppt VIP
- 配网自动化系统.ppt
- 《双碳管理基础与实务》课件——第七章 碳足迹与碳消费.pptx VIP
- 《双碳管理基础与实务》课件——第八章 欧盟碳计划.pptx VIP
- 工程进度计划与保证措施.docx VIP
- 广州市天河区2022年六年级《语文》上册期末试卷与参考答案(部编版).docx VIP
原创力文档


文档评论(0)