一种CSV大文件快速写入到HDFS的方法及系统.pdfVIP

  • 5
  • 0
  • 约1.23万字
  • 约 12页
  • 2023-05-05 发布于四川
  • 举报

一种CSV大文件快速写入到HDFS的方法及系统.pdf

本申请提出了一种CSV大文件快速写入到HDFS的方法,该方法具体包括:S1、获取CSV的大文件,并逐行读取所述CSV的大文件的数据内容;S2、将读取的每行所述数据内容拼接到字符串中,每行所述数据内容之间用特殊字符分割开;S3、判断当前读取的所述数据内容是否大于某一数值X,若大于则将所述数据内容写入小文件,清空当前的所述字符串,并记录生成的所述小文件的名称以及路径,否则继续;S4、判断所述数据内容是否读取结束,将未写入的剩余所述数据文件写入剩余小文件中;S5、创建HDFS文件,读取所述小文件的数据

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114297170 A (43)申请公布日 2022.04.08 (21)申请号 202111625921.3 (22)申请日 2021.12.28 (71)申请人 厦门安胜网络科技有限公司

文档评论(0)

1亿VIP精品文档

相关文档