5知识获取与知识发现资料.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
知识获取与知识发现 知识获取 机器学习 知识发现与数据挖掘 重点与难点 重点 掌握知识获取定义,理解各种知识获取方法,以及知识获取在智能信息系统中的应用。 难点 如何进行知识获取。 一、知识获取 知识获取是把所需要的知识从知识源中抽取出来,并将其转换成可被计算机程序利用的表示形式的过程,是知识工程的关键工序。 知识获取是智能信息系统开发中的一个“瓶颈”。 知识获取贯穿于智能信息系统生命周期的始终,可分为早期、中期、和后期三个阶段。 知识获取的任务和目标 知识获取的任务包括: 获取知识:获取事实和规则、从规则演绎新的事实,描述基本元素、定义概念 精练和维护知识:分类、整合、精练知识;维护一致性、完整性,修改事实和规则 知识获取的任务和目标 在智能信息系统中,知识获取的目标和任务可概括为以下三个方面: 领域知识的获取 用户知识的获取 专家知识的获取 领域知识的获取 领域知识就是专业领域的概念术语及其相互关系的描述。 领域知识的主要表达方法是概念知识库,它是描述问题领域和智能提问处理的重要工具,直接影响着系统的执行效率。 领域知识获取的主要工作是建立、修改和扩充概念知识库,即获取基本概念、复合概念及概念之间的各种语义关系,建立分类层次结构。 领域知识的获取 领域知识的来源形式不同,其获取方法也不同: 文本知识的获取 多媒体知识的获取 Web知识的获取 文本知识的获取 文本知识发现 自动文本分类 自动文本摘要 文本知识发现 多媒体知识的获取 多媒体知识来源于对多媒体数据库的知识挖掘和获取 特征分析与提取 语义分析与抽取 Web知识的特点 Web的信息量过于庞大 Web上的数据形式多样,结构复杂 Web是一个动态性极强的信息源 Web面对的是一个广泛的形形色色的用户群体 Web知识的获取 Web知识的获取可以定义为:从与WWW相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息。它大体上可以分为如下三类: Web内容挖掘 Web结构挖掘 Web记录的挖掘 Web知识的获取 在Web知识获取的研究领域,目前比较受关注的问题有: 权威Web页面的识别 web用户日志的挖掘 Web文档的自动分类 用户知识的获取 用户知识包括用户的身份、目标、兴趣、系统经验和用户背景知识、偏好的交互方式等,它可通过用户模型来描述。 智能信息系统通过用户模型,能比较准确地预测用户的行为和信息需求,从而使系统行为变得更为有效。 用户知识的获取模型 用户知识获取的主要目标之一是获取和学习用户的兴趣偏好。 用户的兴趣偏好包括两种: 长期偏好 短期偏好 用户知识的获取模型 专家知识的获取 专家知识是指专家执行专门任务的决策规则和技能,它们是系统执行各种推理的基础。 使用专家知识的优点: 使系统能够在无人监督的情况下,高效、准确、迅速地工作。 使专家知识突破时间和空间的限制,长久保存,并可复制任意多的副本或在网上供不同地区或不同部门的人使用。 知识获取方法 非自动知识获取方法 知识工程师获取知识,通过知识编辑软件输入到知识库 自动知识获取 自然语言理解 模式识别 机器学习 数据挖掘与知识发现 机器感知 知识获取的主要技术 机器学习 数据挖掘 知识获取与机器学习 知识获取 机器学习 知识发现与数据挖掘 何为机器学习 心理学中的解释:学习是指(人或动物)依靠经验的获得而使行为持久变化的过程。 Simon认为:如果一个系统能够通过执行某种过程而改进它的性能,这就是学习。 Minsky认为:学习是在人们头脑中(心理内部)进行有用的变化。 Tom M. Mitchell在《机器学习》一书中对学习的定义:对于某类任务T和性能度P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,则称这个计算机程序从经验E中学习。 当前关于机器学习的许多文献中大都认为:学习是系统积累经验以改善其自身性能的过程。 ① 学习与经验有关; ② 学习可以改善系统性能; ③ 学习是一个有反馈的信息处理与控制过程。因为经验是在系统与环境的交互过程中产生的,而经验中应该包含系统输入、响应和效果等信息。因此经验的积累、性能的完善正是通过重复这一过程而实现的。 学习的基本模型 人类是如何学习的? 基本过程:观察?响应 学习的基本模型 人类是如何学习的? 学习的基本模型 应用过程 机器学习的分类 1. 基于学习策略的分类 1)模拟人脑的机器学习 符号学习:模拟人脑的宏观心理级学习过程,以认知心理学原理为基础,以符号数据为输入,以符号运算为方法,用推理过程在图或状态空间中搜索,学习的目标为概念或规则等。 典型方法:记忆学习、示例学习、演绎学习、类比学习、解释学习等。 神经网络学习(或连接学习):模拟人脑的微观生理级学习过程,以脑和神经科学原理为基础,以人工神经网络为

文档评论(0)

三哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档