下面我们以下面的图为例,来详细叙述Stage的划分
2.此时的栈不空将栈里面的RDD G弹出,作为参数传入visit函數内
3.RDD G没有被访问过,所以执行if中的代码
stage划分算法总结:
1.在submitMissingTasks中会通过调用以下代码来获取任务的本地性。
无论是通过哪种方式获取RDD分区的优先位置,第一次计算的数据来源肯定都是通过RDD的preferredLocations方法获取的不同的RDD有不同的preferredLocations实现,但是数据無非就是在三个地方存在被cache到内存、HDFS、磁盘,而这三种方式的TaskLocation都有具体的实现
版权声明:本文为博主ouening原创文章未经博主允许不得恶意复制转载,需要注明出处尊重知识成果!技术交流请联系@/ouening/article/details/
0 根据高斯勒让德积分,先将积分区间变换为 [?1,1]使用線性变换: