Spark面试系列-01
Spark面试系列-01 1. Spark 是什么? Spark是一种快速、通用、可扩展的大数据分析引擎。 2009年诞生于加州大学伯克利分校AMPLab。2010年开源,2013年6月成为Apache孵化项目。2014年2月成为Apache顶级项目。 目前,Spark生态系统已经发展成为一个包含多个子项目的集合,其中包含SparkSQL、SparkStre

2022年7月17日
大约 17 分钟
Spark面试系列-02
Spark面试系列-02 1. Spark Streaming 工作流程和 Storm 有什么区别? Spark Streaming与Storm都可以用于进行实时流计算。但是他们两者的区别是非常大的。 Spark Streaming和Storm的计算模型完全不一样,Spark Streaming是基于RDD的,因此需要将一小段时间内的,比如1秒内的数据,收集

2022年7月17日
大约 12 分钟
Spark面试系列-03
Spark面试系列-03 1. Spark 集群运算有哪些模式? Spark有很多种模式,最简单就是单机本地模式,还有单机伪分布式模式,复杂的则运行在集群中,目前能很好的运行在Yarn和Mesos中,当然Spark还有自带的Standalone模式,对于大多数情况Standalone模式就已经足够,如果企业已经有Yarn或者Mesos环境,也是很方便部署的。

2022年7月17日
大约 3 分钟