尚硅谷大数据技术Spark教程-笔记07【Spark内核源码(环境准备、通信环境、应用程序执行、shuffle、内存管理)】

news/2024/7/20 12:44:10 标签: 大数据, spark, 通信环境, shuffle, 内存管理
  • 尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】
  • 视频地址:尚硅谷大数据Spark教程从入门到精通_哔哩哔哩_bilibili
  1. 尚硅谷大数据技术Spark教程-笔记01【SparkCore(概述、快速上手、运行环境、运行架构)】
  2. 尚硅谷大数据技术Spark教程-笔记02【SparkCore(核心编程,RDD-核心属性-执行原理-基础编程-并行度与分区-转换算子)】
  3. 尚硅谷大数据技术Spark教程-笔记03【SparkCore(核心编程,RDD-转换算子-案例实操)】
  4. 尚硅谷大数据技术Spark教程-笔记04【SparkCore(核心编程,RDD-行动算子-序列化-依赖关系-持久化-分区器-文件读取与保存)】
  5. 尚硅谷大数据技术Spark教程-笔记05【SparkCore(核心编程,累加器、广播变量)】
  6. 尚硅谷大数据技术Spark教程-笔记06【SparkCore(案例实操,电商网站)】
  7. 尚硅谷大数据技术Spark教程-笔记07【Spark内核&源码(环境准备、通信环境、应用程序执行、shuffle内存管理)】
  8. 尚硅谷大数据技术Spark教程-笔记08【SparkSQL(介绍、特点、数据模型、核心编程、案例实操、总结)】
  9. 尚硅谷大数据技术Spark教程-笔记09【SparkStreaming(概念、入门、DStream入门、案例实操、总结)】

目录

尚硅谷大数据技术Spark教程-笔记07【Spark内核&源码()】

00【总体介绍】

P128【128.尚硅谷_Spark内核 & 源码 - 总体介绍】05:38

01【环境准备】

P129【129.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 起点】06:30

P130【130.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 向Yarn提交应用】13:28

P131【131.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 启动ApplicationMaster】14:20

P132【132.尚硅谷_Spark内核 & 源码 - 环境准备 - ApplicationMaster - 启动Driver线程】10:21

P133【133.尚硅谷_Spark内核 & 源码 - 环境准备 - ApplicationMaster - 启动Executor进程】15:23

P134【134.尚硅谷_Spark内核 & 源码 - 环境准备 - ExecutorBackend - 创建Executor计算对象】17:30

P135【135.尚硅谷_Spark内核 & 源码 - 环境准备 - 流程梳理】10:30

02【通信环境

P136【136.尚硅谷_Spark内核 & 源码 - 通信环境 - 通信原理】07:56

P137【137.尚硅谷_Spark内核 & 源码 - 通信环境 - 通信组件】12:44

P138【138.尚硅谷_Spark内核 & 源码 - 通信环境 - 课件梳理】04:22

03【应用程序的执行】

P139【139.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 上下文对象SparkContext】07:23

P140【140.尚硅谷_Spark内核 & 源码 - 应用程序执行 - RDD依赖关系】07:27

P141【141.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 阶段的划分】13:45

P142【142.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的切分】06:13

P143【143.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的调度】16:52

P144【144.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的执行】05:07

P145【145.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 课件梳理】06:22

shuffle-toc" style="margin-left:40px;">04【shuffle

shuffle%20-%20%E5%8E%9F%E7%90%86%E5%9B%9E%E9%A1%BE%E3%80%9107%3A04-toc" style="margin-left:80px;">P146【146.尚硅谷_Spark内核 & 源码 - shuffle - 原理回顾】07:04

shuffle%20-%20%E5%9B%BE%E8%A7%A3%E3%80%9112%3A19-toc" style="margin-left:80px;">P147【147.尚硅谷_Spark内核 & 源码 - shuffle - 图解】12:19

shuffle%20-%20%E5%AE%9E%E7%8E%B0%E8%BF%87%E7%A8%8B%E3%80%9108%3A16-toc" style="margin-left:80px;">P148【148.尚硅谷_Spark内核 & 源码 - shuffle - 实现过程】08:16

shuffle%20-%20%E5%86%99%E6%B5%81%E7%A8%8B%E6%BA%90%E7%A0%81%E8%A7%A3%E8%AF%BB%E3%80%9115%3A47-toc" style="margin-left:80px;">P149【149.尚硅谷_Spark内核 & 源码 - shuffle - 写流程源码解读】15:47

shuffle%20-%20%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F%E5%92%8C%E8%AF%BB%E6%B5%81%E7%A8%8B%E3%80%9116%3A20-toc" style="margin-left:80px;">P150【150.尚硅谷_Spark内核 & 源码 - shuffle - 归并排序和读流程】16:20

shuffle%20-%20%E8%AF%BE%E4%BB%B6%E6%A2%B3%E7%90%86%E3%80%9105%3A56-toc" style="margin-left:80px;">P151【151.尚硅谷_Spark内核 & 源码 - shuffle - 课件梳理】05:56

05【内存的管理】

P152【152.尚硅谷_Spark内核 & 源码 - 内存管理】18:51


尚硅谷大数据技术Spark教程-笔记07【Spark内核&源码()】

00【总体介绍】

P128【128.尚硅谷_Spark内核 & 源码 - 总体介绍】05:38

  1. 环境准备(Yarn集群)
    1. Driver,Executor
  2. 组件通信
    1. Driver => Executor
    2. Executor => Driver
    3. Executor => Executor
  3. 应用程序的执行
    1. RDD依赖
    2. 阶段的划分
    3. 任务的切分
    4. 任务的调度
  4. Shuffle
    1. Shuffle的原理和执行过程
    2. Shuffle写磁盘
    3. Shuffle读取磁盘
  5. 内存的管理
    1. 内存的分类
    2. 内存的配置

01【环境准备】

P129【129.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 起点】06:30

spark-submit --class org.apache.spark.examples.SparkPi --master local[2] ../examples/jars/spark-examples_2.12-3.0.0.jar 10

java org.apache.spark.deploy.SparkSubmit

java HelloWorld

JVM=>Process (SparkSubmit)

SparkSubmit.main

jps

P130【130.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 向Yarn提交应用】13:28

//准备提交环境
(childArgs, childClasspath, sparkConf, childMainClass) = prepareSubmitEnvironment(args)
childMainClass = org.apache.spark.deploy.yarn.YarnClusterApplication

P131【131.尚硅谷_Spark内核 & 源码 - 环境准备 - SparkSubmit - 启动ApplicationMaster】14:20

P132【132.尚硅谷_Spark内核 & 源码 - 环境准备 - ApplicationMaster - 启动Driver线程】10:21

P133【133.尚硅谷_Spark内核 & 源码 - 环境准备 - ApplicationMaster - 启动Executor进程】15:23

P134【134.尚硅谷_Spark内核 & 源码 - 环境准备 - ExecutorBackend - 创建Executor计算对象】17:30

P135【135.尚硅谷_Spark内核 & 源码 - 环境准备 - 流程梳理】10:30

01_尚硅谷大数据技术之SparkCore.pdf

第1章  Spark概述

04_尚硅谷大数据技术之Spark内核.pdf

2.2 Standalone模式运行机制

02【通信环境

P136【136.尚硅谷_Spark内核 & 源码 - 通信环境 - 通信原理】07:56

组件通信

P137【137.尚硅谷_Spark内核 & 源码 - 通信环境 - 通信组件】12:44

P138【138.尚硅谷_Spark内核 & 源码 - 通信环境 - 课件梳理】04:22

04_尚硅谷大数据技术之Spark内核.pdf

第 3 章 Spark 通讯架构

3.1 Spark 通信架构概述

03【应用程序的执行】

P139【139.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 上下文对象SparkContext】07:23

P140【140.尚硅谷_Spark内核 & 源码 - 应用程序执行 - RDD依赖关系】07:27

P141【141.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 阶段的划分】13:45

 

P142【142.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的切分】06:13

P143【143.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的调度】16:52

  1. 环境准备(Yarn集群)
    1. Driver,Executor
  2. 组件通信
    1. Driver => Executor
    2. Executor => Driver
    3. Executor => Executor
  3. 应用程序的执行
    1. RDD依赖
    2. 阶段的划分
    3. 任务的切分
    4. 任务的调度
  4. Shuffle
    1. Shuffle的原理和执行过程
    2. Shuffle写磁盘
    3. Shuffle读取磁盘
  5. 内存的管理
    1. 内存的分类
    2. 内存的配置

P144【144.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 任务的执行】05:07

P145【145.尚硅谷_Spark内核 & 源码 - 应用程序执行 - 课件梳理】06:22

04_尚硅谷大数据技术之Spark内核.pdf

第 4 章 Spark任务调度机制

shuffle">04【shuffle

shuffle%20-%20%E5%8E%9F%E7%90%86%E5%9B%9E%E9%A1%BE%E3%80%9107%3A04">P146【146.尚硅谷_Spark内核 & 源码 - shuffle - 原理回顾】07:04

shuffle%20-%20%E5%9B%BE%E8%A7%A3%E3%80%9112%3A19">P147【147.尚硅谷_Spark内核 & 源码 - shuffle - 图解】12:19

 

 

shuffle%20-%20%E5%AE%9E%E7%8E%B0%E8%BF%87%E7%A8%8B%E3%80%9108%3A16">P148【148.尚硅谷_Spark内核 & 源码 - shuffle - 实现过程】08:16

shuffle%20-%20%E5%86%99%E6%B5%81%E7%A8%8B%E6%BA%90%E7%A0%81%E8%A7%A3%E8%AF%BB%E3%80%9115%3A47">P149【149.尚硅谷_Spark内核 & 源码 - shuffle - 写流程源码解读】15:47

shuffle%20-%20%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F%E5%92%8C%E8%AF%BB%E6%B5%81%E7%A8%8B%E3%80%9116%3A20">P150【150.尚硅谷_Spark内核 & 源码 - shuffle - 归并排序和读流程】16:20

shuffle%20-%20%E8%AF%BE%E4%BB%B6%E6%A2%B3%E7%90%86%E3%80%9105%3A56">P151【151.尚硅谷_Spark内核 & 源码 - shuffle - 课件梳理】05:56

04_尚硅谷大数据技术之Spark内核.pdf

5.1.1 ShuffleMapStage与ResultStage

05【内存的管理】

P152【152.尚硅谷_Spark内核 & 源码 - 内存管理】18:51

 


http://www.niftyadmin.cn/n/338797.html

相关文章

中间件(三)- Zookeeper

Zookeeper 1. Zookeeper介绍1.1 什么是Zookeeper1.2 Zookeeper的应用场景 2. 搭建ZooKeeper服务器2.1 下载安装包2.2 配置文件2.3 启动测试 3. Zookeeper内部的数据模型3.1 zk如何保存数据?3.2 zk中的znode是什么样的数据结构3.3 zk中节点znode的类型3.4 zk的数据持久化 4. Zo…

内网渗透之权限维持-自启动映像劫持粘滞键辅助屏保后门WinLogon

0x01权限维持-自启动 以下几种方法都需服务器重启 1、自启动路径加载 C:\Users\Administrator\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startup 将木马放到此目录,等待服务器重启即可 2、自启动服务加载 sc create ServiceTest binPath C:\1.exe …

38、Solr Integration(2)Install Solr

文章目录 38、Solr Integration(2)Install Solr下载启动创建Core填充数据搜索测试 38、Solr Integration(2)Install Solr 下载 进入Solr下载页面Solr Downloads - Apache Solr 下载需要的版本,这里下载最新版9.2.1&a…

【HarmonyOS】【JS】小白的鸿蒙学习之路2--小小的图片啊,动呀动起来

【关键字】 image组件、动画 【介绍】 今天和大家分享下,我在官网上学习的一篇Codelab。这篇帖子通过一个代码示例,实现image组件的平移、缩放、旋转和透明度变化效果。话不多说,我们一起学起来吧! 【成果展示】 【开发步骤】 …

如何让数据安全管理工作化繁为简?uDSP 十问十答

数据安全管理工作与国家数据安全、企业资产保护以及个人信息保护工作息息相关。复杂、多元、流通的数据也给数据安全带来了更多的威胁和挑战,如数据资产管理、分类分级问题,数据安全集中管控问题,数据共享与流通问题等。原点安全一体化数据安…

nginx 报错 500

500 Internal Server ErrorPermission denied# cat /etc/passwd www-data:x:33:33:www-data:/var/www:/usr/sbin/nologin# cat /etc/group www-data:x:33:# members www-data www-datanginx 默认用户名为www-data,网站目录不能放在/root路径下,会导致权限…

AI为文档图像安全注入新力量

Hello大家好。我是Dream。 随着人工智能和大数据技术的快速发展,人们对于文档图像安全的关注度越来越高。尤其是在当下,AIGC取得了里程碑式的成绩,引发了市场广泛热烈的兴趣,扩散模型在内的关键技术取得突破,技术可用性…

基于SpringBoot的完成SSM整合项目开发

整合第三方技术 1. 整合JUnit问题导入1.1 Spring整合JUnit(复习)1.2 SpringBoot整合JUnit 2. 基于SpringBoot实现SSM整合问题导入2.1 Spring整合MyBatis(复习)2.2 SpringBoot整合MyBatis2.3 案例-SpringBoot实现ssm整合 1. 整合JU…