试题详情
- 多项选择题spark的源码是由哪几种语言编写完成的()
A、acheSpark是一种快速、通用、可扩展的大数据分析引擎
B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集
C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费
D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
- A,B
关注下方微信公众号,在线模考后查看
热门试题
- 有一段如下代码,其中打印出来结果先后顺序
- spark的组件不包含哪个()
- stage的task数量是由什么决定的(
- scala中没有静态的成员与静态方法,可
- spark中可以整合机器学习库,并可以对
- 以下选项属于rdd特性的是()
- 以下哪些属于数值类型?()
- 表达式for(i<-1to3;for(j
- distinct算子对源RDD进行去重后
- Kafka是LinkedIn使用什么语言
- spark中一个action算子对应一个
- 函数可以没有名字
- 关于spark中cache算子与pers
- 只有主构造函数才可以写参数
- etl处理完成的数据可以存在以下哪些组件
- spark切分完的partition的个
- sparkSql不能使用jdbc读取数据
- 在scala中对于列表操作以下对于这些列
- 一个application就是一个spa
- sparkSql不能够连接jdbc