网站大量收购独家精品文档,联系QQ:2885784924

rosetta使用手冊.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
rosetta使用手冊

Rosetta的使用手册 波兰工业大学计算机科学研究所智能决策支持系统实验室设计的RSES系统作为可选组件,被嵌入其计算核心。本文中与其相关的算法带有前缀“RSES”。 简介: 本文件构成了技术参考了Rosetta软件手册。对主要算法及其选项进行简要介绍,并给出相关的引用文献。 本手册不应孤立的阅读。读者应参考相关文献和相关理论背景。手册中使用通用的符号和术语。本手册是在假定读者已具有数据挖掘和知识发现的基础。此外,还必须了解典型的经验模型是如何实现的334。在参考文献[26]中,有Rosetta应用的小例子,还有其如何使用等知识,包括对数据分类的验证。 在在Rosetta图形用户界面,相同的菜单项出现了许多不同类型的对象。例如,所有的对象在他们的弹出式菜单项都有一个“注解... ”。 Rosetta图形界面细节: 一个决策系统可以通过“Open”被读入新工程中,它将会出现在“Structure”的工程树下。 工程树的节点可以被收起或打开。 3 工程 项目:工程 描述:项目对象是项目树顶层结构对象。根项目不能从图形界面中删除。一个项目可能有数个子项目。 3.1 ODBC 项目:ODBC决策表导入 描述:允许从各种数据源通过“开放式数据库互连”的方法导入表格数据, 如电子表格、关系数据库等。 对话框:图1、图2 3.2 报告 描述:这类算法输出关于项目的信息和元信息。该算法函数只做简单的转换,是该算法的附加功能。 可输出XML、HTML格式 3.3 注释 注释包括一般标注信息和一个历史记录列表。部分信息会自动生成,这有助于生成Rosetta系统文件。 注释还拥有一个文件名。当使用保存时,该对象被保存到这个相应位置。 4 决策表 信息系统和决策系统都代表相同的结构。在表中,所有的所有属性值集以整数表示。因此,信息系统在本质上可被看作一个整数的矩阵。表中整数和其在模型中意义的映射关系由和每个信息系统相关的数据字典处理。关于数据字典的描述见4.1节。 4.1 数据字典 每一个决策表都有一个与之相关的数据字典。用于将实际表格以不同数据格式表示并替代。 数据字典有几个字典属性,表格中每个属性与它相联系。它们之间的映射取决于属性的类型。字典属性还可完成逆映射,字典中的每个属性也拥有的名称和属性的单位。 比如,设v∈Va,令v=125。如果a是整数属性,则v映射到字符串125;如果a是一个浮点属性,且n=2,则v映射到字符串1.25;如果a是字符属性,v映射到“One hundred and twenty five”。 4.2 查看 打开决策表,进行检查。灰色项目表示属性被标记,可使其不参与运算。决策属性以粗体表示,且在表中最右边。整型和浮点型属性右对齐,字符串属性为中心对齐。 右键点击可弹出菜单栏。隐藏属性可以通过点击弹出菜单中的“Masking…”。 通过“Use Dictionary…”菜单可以改变查看模式。 通过“Swap…”可以转换两列。 通过“Join…”可以连接两列。 当对决策表有进一步操作后,就不能再得到修改了,此时,可以将其复制,然后修改。 4.3 字典 输出: 输出一个关于决策表与ASCⅡ的数据字典。输出的文件可被手工编辑并重新导入系统。 输入: 可以输入手动编辑的文件,其格式见A.1节。 4.4 输出 此功能算法实现以一定的格式输出关于决策表的某些方面信息,仅仅起到格式转换的作用。可输出XML、Prolog、Matlab、Plain、Indiscernibility graph、Discernibility functions文件。 4.5 数据的补齐 此功能算法主要完成数据的补齐,是否需要补齐取决于后续决策表的运算要求。如果使用IDG 就不需要补齐。某些情况下,对于空缺的数值,算法会将其当做“不适用的”而不是“无记录的”,这种情况下,就不需要补齐。 通常调节补齐决策表数据是可取的。以下列步骤进行: 1.将表格分割成几个子表,每个都有自己的决策类。 2.对每个子表套用无条件补齐器。 3.混合补齐的子表,合成总表。 对于完成信息的保存尚未实现。 4.5.1 数据补齐 移除不完整法 移除所有有一个或多个数据空缺的对象。以u和u/表示移除前后不完整对象,则: 4.5.2 均值填充 利用现存属性值的平均值作为缺失属性的属性值。对于字符属性,缺失的属性用现存属性中出现频率最高的模式值代替。 如果a 和a/ 分别表示补齐前后的属性,有: 4.5.3 平均条件填充 与4.5.2节中的算法类似,但计算均值和模式值时要和决策属性相互适应。对于决策属性为“未定义”的情况,不会对其进行补齐。 4.5.4 组合填充 将任何可能的值作为缺失的属性值。就是说,使用可能出现的值作为缺失值,将一个决策表扩大为很多决策表。 该算

文档评论(0)

bmdj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档