- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
知识工程复习题26
《专家系统与知识工程》复习要点
知识是数据和信息集合的整体。只有当信息被系统地、有目的地积累起来时,才能转变成知识。
知识是由信息描述的,信息则是用数据来表达的;
知识工程是设计和实现知识库系统及知识库应用系统的理论、方法和技术,是研究知识获取、知识表示、知识管理和知识运用的一门学科。
数据工程处理的对象是数据,即反映信息的数据。
知识工程处理的对象是知识。即信息之间关联的关联。
软件工程处理的对象是模块,即软件模块或构件。
知识工程是一个远比数据工程复杂的多的领域,也是一个比数据工程更富于挑战性的领域,表现在:1、知识种类比较多2、知识的表示方式比较多3、要有一个较好的知识表示方式和知识管理机制。
知识工程与数据工程关系:
数据工程是为了创建一种数据库系统以及数据库应用系统,知识工程则是为了创建一种知识库系统以及知识库应用系统。它们都是一种应用软件或软件系统,其开发过程也遵从软件工程的一般原则。但也有其本质上的差别:
知识工程应用系统的形成也需要经过三个阶段:
1、需求分析阶段(what-to-do):数据工程:把E-R图作为分析阶段的结果。知识工程:还要分析问题之间的关联关系,从而定义问题的求解规则。
2、设计阶段(how-to-do):数据工程:要解决的问题是从概念结构的关联中寻找极小化的逻辑结构。知识工程:要解决的问题是从概念结构的关于关联的关联中寻找极小化的逻辑结构。
3、实现阶段(do-to-do):数据工程:按照要求对数据库中的数据进行适当的调整。 知识工程:除了针对具体问题做一些适当的调整外,几乎不做什么事情。
在知识工程中,最为困难的问题是知识获取,一般来说,知识获取的方法有两种情况:
1、由知识工程师从领域专家那里获取知识,即:人工获取。
2、从数据库数据中发现知识(KDD),即数据挖掘。
决策支持系统(DSS—decision support system)
数据挖掘(DW—Data Warehouse )
数据仓库是一个“面向主题的”、“完整的”、“非易失的”、“不同时间的”、“用于支持决策管理”的数据集合,用以支持经营管理中的决策制定过程。
数据仓库 是为决策支持服务的; 数据库系统是为事务处理服务的。
非易失性指的是数据仓库是只读的,数据一旦经集成进入数据仓库后,数据一般不能被回写,也就是说数据是稳定的,具有稳定性
数据仓库中的数据时限为: 5-10年
数据仓库和数据库存在着根本不同:1、数据存储方式的不同 2、数据存储量的不同 3、存储的结构不同
数据仓库的数据量是数据库数据量的100倍,数据量大的原因在于:
(1)数据库中的数据是按决策主题重新组织并集成起来的数据;
(2)保留了大量的历史数据,用于预测分析;
(3)对当前数据进行了轻度或高度综合后形成 了综合数据。
数据仓库中的数据
=当前数据 + 历史数据 + 综合数据
粒度反映了数据仓库中数据单位中保存数据的细化或综合程度的级别,是数据仓库中数据的最基本元素或单位。
确定数据粒度是设计数据仓库的重要环节,它决定了“怎样去载入数据”,也反映了数据仓库设计师对用户的要求和系统传递的信息单位。在许多实际应用中,数据的粒度级别是不同的。一般来说,细化程度越高,粒度级别就越小;反之,细化的程度越低,粒度级别就越大。高粒度数据不仅只需要很少的字节去存储数据,而且索引项也比较小,这对于节省存储空间提高数据分析效率是有益的。如果数据仓库的空间是有限的话,用高粒度表示数据比用低粒度表示数据的效率高得多。
元数据在数据仓库的建模和运行中起着及其重要的作用,它描述了数据仓库中的各个对象以及数据仓库中的各个方面,是整个数据仓库的核心。元数据描述了数据仓库的数据和环境,是关于数据的数据,
数据仓库中的元数据不仅定义了数据仓库有什么,指明了数据仓库中信息的内容和位置,刻画了数据的抽取和转换规则,存储了与数据仓库主题有关的各种商业信息,而且整个数据仓库的运行都是基于元数据的,如数据的修改、跟踪、抽取、载入和综合等。
标准化实体关系与关系数据库的目标是增加更新效率,但是决策支持数据模型的目标是增加查询效率。
构建星型模型的常用方法有三种:
1、修正方案
2、模型创建
3、自主开发
数据仓库必须具有安全性,通常所采取的安全措施有:
1、服务器的安全管理(包括软、硬件);
2、工作站的安全管理;
3、数据访问的安全管理
所谓基于角色的安全就是指在角色被创建并被授予了适当的数据库权限之后,新的用户仅需要根据与数据仓库交互的需要,注册到一个或多个角色中就行了。
OLAP(联机分析处理,区别于 OLTP联机事务处理)
三层结构不是简单地将数据仓库的处理划分
您可能关注的文档
最近下载
- 基于SpringBoot的在线学习系统的设计与开发.doc
- 毕业设计(论文)-小型水稻联合收割机设计.doc
- 房地产 -22G101-1混凝土结构施工图平面整体表示方法制图规(现浇混凝土框架、剪力墙、梁、板).docx VIP
- 四方股份合作协议书(标准版).docx VIP
- ASME B16.9-2012_工厂制造的锻钢对焊管件(中文版).pdf
- 2025年汽车维修工技师(二级)职业技能鉴定考试题库资料(含答案).pdf
- 变压器油色谱、局放在线监测系统设计实施方案.docx VIP
- 饲料厂安全操作规程.pdf VIP
- 交通标识汇总(全).doc VIP
- 2025届湖北省建设投资集团有限公司校园招聘124人笔试参考题库附带答案详解.pdf
文档评论(0)