各数据导入ORACLE处理说明.docxVIP

  • 3
  • 0
  • 约 12页
  • 2016-08-23 发布于浙江
  • 举报
各数据导入ORACLE处理说明

结构化文本文件入库常见非结构化数据格式如下:文件类型数据格式CSV文件按照逗号作为字段分割符,以每行作为一条记录的数据格式文件。TXT文件按照特定字符作为字段分隔符,以每行作为一条记录的数据格式文件。XLS/XLSX文件OFFICE2003/2007的规范化数据文件。XML文件符合DOM规范的XML规范化数据文件。格式化WORD文件在WORD文件中包含规范化表格信息,以每个表格作为一条记录的格式化数据。其他规范文件如:HTML文件、PPT文件等包含符合某些规范的数据文件。CSV文件/TXT文件入库CSV文件TXT文件以上文件统一采用KETTLE数据抽取工具进行入库,如下图说明:利用大文本编辑工具打开数据(超大文本文件忽略此步骤),点击【视图】中【显示空格/制表符】可准确定位数据分隔符。选择要导入的文件。内容设置文件格式及分隔符。格式固定选择mixed可有效避免格式引起的错误编码格式根据数据预览情况进行修改若数据起始行不在第一行则根据实际修改,若没有字段名则去掉头部后面的√根据第一步填写分隔符直接点击获取字段即可,建议将类型全部设置为string确保顺利入库,点击下方的预览记录查看数据正确性。注意1:较大文件直接获取字段,通过获取到的数据判断数据分隔符后,修改分隔符重新获取即可注意2:无字段名数据可自定义字段名后预览数据,确定自定义字段个数不少于文件数据列数定义文件来源(可忽略),该

文档评论(0)

1亿VIP精品文档

相关文档