试题详情
- 判断题distinct算子对源RDD进行去重后返回一个新的RDD
- 正确
关注下方微信公众号,在线模考后查看
热门试题
- 下面算子中哪些是转换算子()
- spark本身能够读取到hdfs中的数据
- flume中用来缓存数据的组件是chan
- 关于元组Tuple说法错误的是?()
- spark架构中的控制算子算子作用()
- scala中的Object中通常在里面放
- 下列不属于scala数据类型的是()
- 以下关于特征的说法正确的是()
- 在scala中如果使用for循环,其格式
- spark本身自带读取hdfs数据的方法
- Rdd不能够转换成DataFrame
- 常见的scala高阶函数有哪些()
- standalone组件在spark中的
- zookeeper的默认端口号是()
- 以下可以将数据持久化到硬盘的算子是哪个(
- 以下语句的运行结果为varj=2;var
- 在大数据的架构当中flume组件的作用是
- DataFrame可以通过多种来源创建:
- 有一段如下代码,其中打印出来结果先后顺序
- spark切分完的partition的数