大数据处理技术 其它 数据集成分析平台Knime实验.docVIP

大数据处理技术 其它 数据集成分析平台Knime实验.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 1 数据集成分析平台Knime实验 【实验原理】 Knime (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。它给了用户有能力以可视化的方式创建数据流或数据通道,可选择性地运行一些或全部的分析步骤,并以后面研究结果,模型 以及 可交互的视图。 KNIME 由Java写成,其基于 Eclipse 并通过插件的方式来提供更多的功能。通过以插件的文件,用户可以为文件,图片,和时间序列加入处理模块,并可以集成到其它各种各样的开源项目中,比如:R 语言,Weka, Chemistry Development Kit, 和 LibSVM. 【实验内容】 熟悉Knime数据挖掘平台的基本功能 学习可视化地创建数据流,选择性地执行分析步骤,并通过数据和模型的交互式观察来展开结果分析 【实验指导】 打开Windows实验台,运行Windows2003系统。 一.安装Knime 运行工具包中的“knime_2.6.3.win32.win32.x86.exe”,解压缩到到本地目录中 二.打开Knime 进入“knime_2.6.3”目录,双击“knime.exe”,先设置工作目录,选择默认即可,然后进入Knime主界面,如下图 图2.1.1 设置工作目录 图2.1.2 knime主界面 三.创建Knime项目 (1)点击“Open NKIME workbench”,进入KNIME的工作台。如下图 图3.1.1 knime工作台 (2)我们已经准备好了一个Access的数据库,内容包含了5000条汽车GPS的数据,我们的目的是从这5000条记录中筛选出有乘车人的记录。首先我们要把名为text.mdb的Access数据库添加到KNIME中。 (3)添加一个读取数据的流程,从左面菜单的“DataBase”中拖拽一个“Database Reader”到“KNIME_project”工作台中,如下图所示: 图3.1.2 添加节点1 (4)配置该节点。右键点击该节点,选择“Configure…”如下图所示。 图3.1.3 添加节点1 修改“jdbc:odbc:database_name”的内容为“jdbc:odbc:Driver={MicroSoft Access Driver (*.mdb)};DBQ=c: /TEST.mdb”,修改“SQL Statement”窗体中的命令为“select * from gpsdata”,如下图所示: 图3.1.4修改配置 输完后点击OK,如果设置正确图标会亮黄灯,如下图所示: 图3.1.5 然后就可以右键Execute,执行完再右键Data from Database查看结果。如下图所示: 图3.1.6 (5)查看数据表的内容。如下图所示 图3.1.7 (6)分析数据,找到乘客状态为1的数据(PassengerState=1) 添加一个“Row Filter”的流程:依次打开“Node Repostory-Data Manipulation-Row-Filter-Row Filter”,拖拽至工作台中,如下图所示: 图3.1.8 (7)配置Row Filter。从“Database Reader”右边的三角形中拽一条线至“Row Filter”,以连接两个工作流,然后右键点击“Row Filter”,选择“Configure…”,如下图所示。 图3.1.9 下拉列表框“select the column to test”选择“passengerstate”,“pattern”内容填写“1”,点击“ok”。如下图所示: 图3.1.10 同样执行“node2”,然后查看数据集,可以看到已经把所有passengerstate为“1”的数据筛选出来了。如下图所示: 图3.1.11 查看结果

文档评论(0)

WanDocx + 关注
实名认证
文档贡献者

大部分文档都有全套资料,如需打包优惠下载,请留言联系。 所有资料均来源于互联网公开下载资源,如有侵权,请联系管理员及时删除。

1亿VIP精品文档

相关文档