- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【盛唐】JAVA版数据清洗工具操作手册v1.0
文档密级:普通
文档状态:[√ ] 草案 [ ]正式发布 [ ]正在修订
变更履历
序号 版本 变更描述 修订人 审核/日期 批准/日期 1.0 草案 屈雪
目录
1 系统初始化 3
1.1 创建MySQL中间库etl-mid 3
1.2 修改中间库配置文件conf/mysql.xml 5
1.2.1 中间库配置文件 5
1.3 导入建表脚本conf/etl-mid.sql 5
2 系统启动 7
2.1 启动ETL工具 7
3 主界面 8
3.1 系统主界面 8
3.1.1 主界面介绍 8
4 模块功能 9
4.1 任务 9
4.1.1 任务 9
4.1.2 打开配置文件 9
4.1.3 配置文件编写指导 10
4.1.4 测试数据源(是否可以连接数据库) 11
4.1.5 执行任务或停止任务 12
4.1.6 定时设置 14
4.1.7 详细错误日志 15
4.2 字典管理 16
4.2.1 字典管理主界面 16
4.2.2 机构类别管理 17
4.2.3 字典管理 23
4.2.4 字典子项管理 25
4.3 参数配置 27
4.4 系统帮助 28
4.4.1 系统帮助 28
5 常见或重点关注的问题 29
5.1 导入字典文本 29
5.1.1 格式及编码 29
5.2 数据库 30
5.2.1 密码 30
系统初始化
创建MySQL中间库etl-mid
1.安装MySQL数据库。
2.安装Navicat Premium数据库管理工具。
图 1- 1:安装Navicat Premium
3.创建新连接,操作如图1-2所示。
图 1- 2:创建新连接
4.添加数据库连接信息,操作如图1-3所示。
图 1- 3:连接数据库
5.右键点击连接,新建数据库。操作如图1-4所示。
图 1- 4:新建数据库
6.新建数据库,操作如图1-5所示。数据库名称为:“etl-mid”。字符集需选择“utf-8—UTF-8 Unicode”;排序规则设置为“utf8_general_ci”。
图 1- 5:新建数据库
修改中间库配置文件conf/mysql.xml
中间库配置文件
1.中间库配置文件为文件夹config下的mysql.xml。
图 1- 6:中间库配置文件
2.中间库配置文件中,可以配置服务器名称、数据库名称、登录名、密码和数据源最大连接数,如图1-7所示。
图 1- 7:中间库配置
导入建表脚本conf/etl-mid.sql
1.打开管理工具Navicat Premium,右键点击数据库,运行SQL文件。
图 1- 8:运行SQL文件
2.选择运行的sql文件(如图1-9所示),操作如图1-10所示。
图 1- 9:中间库
图 1- 10:运行SQL文件
3.也可以导入建表脚本,输入命令行:sourse 文件目录/conf/etl-mid.sql。
系统启动
启动ETL工具
1.将名为ETLTools.rar的压缩包解压,得到如图2-1所示的文件夹appTool。
图 2- 1:解压压缩包
2.进入文件夹,双击etltools.jar,启动工具,如图2-3所示。
图 2- 2:双击启动工具
图 2- 3:工具主界面
主界面
系统主界面
主界面介绍
1.通过顶端导航选择操作;其它三个区域可进行相关信息的查看。
图 3- 1:主界面介绍
2.可以通过点击如图3-2所示的箭头,伸缩区域,方便查看相应信息。也可以通过鼠标,拖动边框,调整区域适合的大小。
图 3- 2:区域伸缩
模块功能
任务
任务
1.点击“任务”,可以看到如图4-1所示菜单。
图 4- 1:点击任务
打开配置文件
1.点击“打开配置文件”,位置如图4-2所示。弹出如图4-4所示窗口。
图 4- 2:打开配置文件
2.选择配置文件,并打开,任务列表中将添加一条任务(当任务taskId没有重复,且配置文件编码为UTF-8时)。配置文件写法,可参考template.xml。操作如图4-4所示。
图 4- 3:配置文件模板
图 4- 4:选择配置文件
图 4- 5:添加新的任务
配置文件编写指导
1.mysql.xml配置文件为该工具的数据库配置文件,即中间库配置文件。根据实际情况修改服务器地址,数据库名称等信息。
图 4- 6:清洗工具数据库配置
2.添加任务时需打开配置文件,配置文件编写请参考template.xml。mysql、sqlserv
您可能关注的文档
- 【精华】高中生物必修二1-4HF撒.ppt
- 【精品】湖北三和管桩有限公司码头工程项目53.doc
- 【精品课件】(第十课+谈中国诗).ppt
- 【课件2】22.1.3二次函数y=a(x-h)2+k的图象和性质.ppt
- 【名师伴你行】2016年高考二轮复习物理第一部分 专题突破篇专题五 物理实验第1讲 力学实验与创新.ppt
- 【名师面对面】2017高考生物大一轮复习 第2单元 种群和群落 第2讲 群落的结构和演替课时作业(必修3).doc
- 【名师面对面】高考生物大一轮复习第单元种群和群落第讲群落的结构和演替课时作业(必修)-精.doc
- 【名师一号】2015届高考物理一轮复习课件:5.4 功能关系 能量守恒定律.ppt
- 【名师一号】2017届高考化学一轮复习 第4章 非金属及其化合物 第1讲 无机非金属材料的主角硅课件 新人教版.ppt
- 【南方凤凰台】2017版高考化学一轮复习专题一化学基础知识课时3氧化还原反应导学案(新).doc
- 【世纪金榜】2017版高考生物一轮复习 第6章 从杂交育种到基因工程课件 新人教版必修2.ppt
- 【世纪金榜】2017版高考生物一轮复习阶段评估检测(四)(新).doc
- 【新步步高版高考生物一轮复习 第四单元 孟德尔定律和染色体与遗传 第讲 自由组合定律(Ⅰ)精练 浙科版-课件.doc
- 【营销培训】超市商品陈列(图文详解).ppt
- 【优化方案】2016届通史版大一轮复习教学讲义选修三 第52课时 第一次世界大战及凡尔赛—华盛顿体系下的和平.doc
- 【优化指导】2016-2017学年高中物理 第3章 力与相互作用 3.1牛顿第三定律课件 沪科版必修1.ppt
- 【优化指导】2016-2017学年高中物理 第11章 机械振动 4 单摆课件 新人教版选修3-4.ppt
- 【优化指导】2016-2017学年高中物理 第14章 电磁波 4-5 电磁波与信息化社会 电磁波谱课件 新人教版选修3-4.ppt
- 【与名师对话】2016届高考生物二轮复习 专题跟踪训练10 第一部分 专题三 第3讲 植物的激素调节.doc
- 【语文】2010届高考复习《语句》专题系列课件14:《常见的修辞方法》.ppt
最近下载
- 汽车底盘构造与维修教案.doc VIP
- 人教版七年级上册数学期末动点问题压轴题专题训练.docx VIP
- GB50173-2014《电气装置安装工程66KV及以下架空电力线路施工及验收规范》.docx VIP
- 1.1 空间向量及其运算(大单元教学设计) 高二数学(人教A版选择性必修第一册).docx
- 2024安徽职业技术学院招聘笔试真题含答案详解.docx VIP
- 山洋伺服电机rs2快速入门手册.pdf VIP
- 生活中的方向第1课时教室里的方向(课件)数学苏教版二年级上册(新教材).pptx VIP
- 宫殿记忆法:提升术.pptx VIP
- 【小学英语】3-6年级整个英语语法体系11页.pdf VIP
- 2025中级经济师《经济基础知识》三色笔记.pdf VIP
文档评论(0)