spark的一个stage里的task是一次处理多个rdd的吗

2025-03-05 00:45:03
推荐回答(1个)
回答1:

几个基本概念: (1)job:包含多个task组成的并行计算,往往由action催生。 (2)stage:job的调度单位。 (3)task:被送到某个executor上的工作单元。 (4)taskSet:一组关联的,相互之间没有shuffle依赖关系的任务组成的任务集。