- 66
- 0
- 约2.94万字
- 约 23页
- 2024-01-07 发布于境外
- 举报
问题1★★★
var、val、def三个关键字之间的区别;伴生类与伴生对象;
(1)问题分析:主要考察Scala中的基本概念,这些是应该熟练掌握的
(2)核心问题回答
var是变量声明关键字,类似于Java中的变量,变量值可以更改,但是变量类型不能更改
val常量声明关键字
def关键字用于创建方法(注意方法和函数的区别)
还有一个lazyval(惰性val)声明,意思是当需要计算时才使用,避免重复计算
类和它的伴生对象同名且存在于同一个文件中,二者互为伴生;可以相互访问私有成员(字段和方
法);
问题2★★★
caseclass是什么,与caseobject的区别是什么
(1)问题分析:主要考察样例类的理解,样例类在Scala、Spark的开发中使用的非常频繁,对其应该
熟练掌握
(2)核心问题回答
样例类是scala中特殊的类。当声明样例类时,如下事情会自动发生:
构造器中每一个参数都成为val。除非它被显示的声明为var(不建议这样做)
提供apply方法。不用new关键字就能够构造出相应的对象
提供unapply方法。让模式匹配可以工作
将生成toString、equals、hashCode和copy方法。除非你显示的给出这些方法的定义
继承了Product和Serializable,即已实现序列化方法和可以应用Product的方法
caseclass是多例的,后面要跟构造参数,caseobject是单例的
此外,caseclass和其他类型完全一样,可以添加方法和字段,扩展它们;
caseclass最大的用处是用于模式匹配。
(3)问题扩展
模式匹配的相关问题
问题3★★★
Spark为什么快,SparkSQL一定比Hive快吗
(1)问题分析:常见问题,但是并不好答,因为只有对两个计算框架有一定程度的理解才能准确回
答。
(2)核心问题回答
通常大家只是说Spark是基于内存计算的,速度比MapReduce要快。或者说内存中迭代计算。其实没有
抓住问题的本质,所有的计算都是发生在内存中的,MR的计算一样是发生在内存中的。
说Spark是基于内存的计算,正确的理解应该:与MR相比Spark积极的使用内存,减少数据的落地。
Spark比MR快主要有两个原因:
MapReduce通常需要将计算的结果(即Job的结果)写入磁盘,然后还要读取磁盘,从而导致了频
繁的磁盘IO;
MapReduce采用了多进程模型,而Spark采用了多线程模型。MapReduce的MapTask和Reduce
Task是进程级别的,而SparkTask则是基于线程模型的,就是说map、reduceTask都是jvm进
程,每次启动都需要重新申请资源,消耗大量时间;Spark则是通过复用线程池中的线程来减少启
动、关闭task所需要的开销;
对于以下查询:
Selectmonth,sum(sales)fromtabgroupbymonth;
这个查询对于MR来说也只需要一个Job就能完成。此时,也许HQL的运行时间也许比SparkSQL还
快,因为MR没有中间的结果数据落地。
结论:Spark快不是绝对的,但绝大多数情况下,Spark都比Hadoop计算要快,特别是在迭代计算
中。这主要得益于其对Spark积极的使用内存以及对JVM使用的优化。
问题4★★★
描述以下你对RDD的理解
(1)问题分析:对Spark基本概念的考察,对RDD同学们都有一定的了解,但是要论述
您可能关注的文档
- Hbase经典常见面试练手题.pdf
- Hive经典常见面试练手题.pdf
- MapReduce经典常见面试练手题.pdf
- 数据库经典面试问题大全.pdf
- 微信公众号开发最佳实践.pdf
- 2026年及未来5年市场数据中国卷烟行业竞争状况及投资发展前景分析报告.docx
- 2026年及未来5年市场数据中国咖啡机行业市场运营态势与投资潜力咨询报告(定制版).docx
- 2026年及未来5年市场数据中国咖啡连锁产业深度调研与投资决策咨询报告.docx
- 2026年及未来5年市场数据中国精氨酸行业市场深度调研及发展趋势与投资前景研究报告.docx
- 2026年及未来5年市场数据中国精细化工市场运行格局及投资战略研究报告.docx
- 三年级下册语文1-8单元默写通关训练(含答案)(2).docx
- 2026年及未来5年市场数据中国金属钒市场发展规划及投资战略可行性预测报告.docx
- 2026年及未来5年市场数据中国金属工艺品行业全景调研及投资可行性报告.docx
- 2026年及未来5年市场数据中国金属家具市场分析及投资战略研究预测可行性报告.docx
- 2026年及未来5年市场数据中国金属膜电阻器行业市场需求预测与投资战略规划分析报告.docx
- 2026年及未来5年市场数据中国金银花行业市场发展战略分析及投资前景专项预测报告.docx
- 2026年及未来5年市场数据中国金银花行业市场研究及投资战略预测报告.docx
- 2026年及未来5年市场数据中国抗氧化剂市场专项调查分析及投资前景预测报告.docx
- 2026年及未来5年市场数据中国救护车市场运行格局及投资战略研究报告.docx
- 2026年及未来5年市场数据中国精细化工行业发展前景预测及投资分析报告.docx
最近下载
- 山东省青岛市20000吨年高档缝纫线用涤纶长丝搬迁20000吨年高档缝纫线用涤纶长丝搬迁(修改).pdf VIP
- 四川省南充市仪陇县2025-2026学年七年级上学期期末语文试题(含答案).docx VIP
- (一模)乌鲁木齐地区2026年高三年级第一次质量物理试卷(含答案).pdf
- 中小学课件 英语阅读课 The Enormous Turnip.pptx VIP
- 山东省日照市开发区2024-2025学年七年级上学期期末生物试题(含答案).docx VIP
- 绿植租摆服务方案设计.docx VIP
- 质量管理体系与措施.docx VIP
- 骨龄的相关课件.pptx VIP
- 一种航空器系统定量相似性分析方法、装置及介质.pdf VIP
- 固定矫治器和矫治技术方丝.ppt VIP
原创力文档

文档评论(0)