- 70
- 0
- 约2.26万字
- 约 99页
- 2022-09-04 发布于甘肃
- 举报
以student表为例,介绍Hive中表数据的插入操作。 使用insert语句在student表中插入一条新的记录(2018213223,‘王小哲’,‘男’,18,‘IS’),查询验证如下图所示。 使用insert语句将student表中数据作为新的数据记录插入表student中。 使用insert语句将student表中数据作为新的数据记录插入表student中,并覆盖原表中的内容。 插入数据 在Hive中默认未开启支持单条更新(update)以及删除(delete)操作。在默认情况下,当用户使用update和delete操作时,会出现报错,如下图所示。 如果需要使用update和delete操作,那么需要在hive-site.xml配置文件中添加配置。 使用truncate关键字将清空整个数据表的所有数据,因此truncate关键字需要谨慎使用。 删除表中数据 1 访问Hive的3种方式 目录 认识Hive数据仓库 2 实现Hive表的创建与修改 3 实现Hive表中数据的增删查改 4 掉线率top10基站统计 5 自我国三大运营商获得无线牌照以来,无线用户发展迅猛,优化维护工作的好坏直接影响运营商的服务质量和满意度。而影响运营商服务质量和满意度的一个重要网络指标之一——掉话率。 因此,统计分析各基站掉话率,有助于运营商做出科学决策,提升网络质量,开展优化维护工作,降低基站掉话率,才能有效的支撑业务发展,提升用户满足度。 本小节的任务如下。 统计出每个基站的掉话率,并按降序排序。 找出掉话率比较高的前20个基站。 任务描述 根据jizhan_information.scv文件中的信息,计算每个基站的掉话率,找出最高掉话率的基站,可以帮助运营商更好的分析高掉话率基站的具体情况,有助于安排维护人员有针对性的进行故障检测。 已知基站掉话率的计算公式,如下图所示。 统计基站的掉话率的实现步骤如下。 上传jizhan_information.csv文件至服务器。 创建myhive数据库并在myhive数据库中创建jizhan结构表。 装载jizhan_information.scv文件中的数据至jizhan表。 创建jizhan_result结果表,用以存储统计掉话率后的信息。 根据掉话率公式统计各基站的掉话率,并按降序排序,找出掉话率Top20个基站。 分析基本思路 首先在root目录下创建jizhan文件夹,并将jizhan_information.csv上传至/root/jizhan_data目录下。 进入myhive数据库,并创建jizhan结构表。 装载jizhan_information.scv文件至jizhan表,并查看jizhan表中的数据,如下图所示。 任务实现 编写HQL语句,并将查询结构存入jizhan_result表中,在统计之前需先创建jizhan_result表结构,以便存储查询结果。 统计基站掉话率,并按照掉话率降序排序。 通过select语句可查看jizhan_result表的内容,如右图所示。 任务实现 本章详细介绍了Hive的基本知识。Hive是一个构建在Hadoop之上的数据仓库工具,主要用于对存储在Hadoop文件中的数据集进行数据整理、特殊查询和分析处理。 本章从Hive与传统数据库的区别出发,通过介绍Hive的基本概念,让读者需要了解Hive以及Hive架构、数据模型及其工作原理;通过介绍Hive的3种访问方式及搭建过程,让读者熟悉Hive的安装步骤和管理。 接着介绍Hive的数据操作,让读者掌握HiveQL的相关操作。 作为初学者,学习Hive需要实际动手操作Hive,这也是掌握Hive的关键,最后以掉线率Top20基站统计为例,详细介绍了如何使用Hive解决具体的实际问题。 小结 (1) 创建表语法格式 在编写ROW FORMAT选项参数时,可以选用以下指定规则。 row_BY char] | SERDE serde_namformat: : DELIMITED [FIELDS TERMINATED BY char] [COLLECTION ITEMS TERMINATED BY char] [MAP KEYS TERMINATED BY char] [LINES TERMINATED e [WITH SERDEPROPERTIES (property_name=property_value, property_name=property_value, ...)] 实现Hive表的创建与修改 (1) 创建表语法格式 SORTED BY:对列
您可能关注的文档
- Hadoop大数据开发基础 第2版 第2章 Hadoop集群的搭建及配置.ppt
- Hadoop大数据开发基础 第2版 第3章 Hadoop基础操作.ppt
- Hadoop大数据开发基础 第2版 第4章 MapReduce编程入门.ppt
- Hadoop大数据开发基础 第2版 第5章 MapReduce进阶编程.pdf
- Hadoop大数据开发基础 第2版 第7章 HBase分布式数据库.ppt
- Hadoop大数据开发基础 第2版 第8章 项目案例:电影网站用户影评分析.ppt
- Hadoop大数据开发基础 第2版 配套课件.pptx
- 2025年最新行政执法考前必刷考试题及答案.pdf
- 2025年度吉林省国资委监管企业集中招考联合(公共基础知识)练习题及答案.pdf
- 2025年法律援助服务条款.pdf
- 2025年山东潍坊中考道德与法治试卷试题真题(含答案详解).pdf
- 2025广西南宁建宁水务投资集团有限责任公司招聘6人笔试模拟试题含答案详解(培优a卷).pdf
- 2025年天津社区工作者考试真题(附答案).pdf
- 2025年高二语文(专项训练)小说人物形象卷.pdf
- 2025年国际军人考试题目及答案.pdf
- 2025年安徽省招聘村居后备干部考试必备题库(附答案).pdf
- 2025年大学《国内安全保卫-意识形态领域安全保卫》考试模拟试题及答案解析.pdf
- 2025年时事热点政治题及参考答案(满分必刷).pdf
- 2025年浙江省宁波市中考英语试题及答案.pdf
- 2025年广东选调生考试申论真题及参考答案.pdf
原创力文档

文档评论(0)