更新時(shí)間:2022-12-14 來源:黑馬程序員 瀏覽量:
IT就到黑馬程序員.gif)
整個(gè)Spark 框架模塊包含:Spark Core、 Spark SQL、 Spark Streaming、 Spark GraphX、 Spark MLlib,而后四項(xiàng)的能力都是建立在核心引擎之上。

Spark Core:Spark的核心,Spark核心功能均由Spark Core模塊提供,是Spark運(yùn)行的基礎(chǔ)。Spark Core以RDD為數(shù)據(jù)抽象,提供Python、Java、Scala、R語言的API,可以編程進(jìn)行海量離線數(shù)據(jù)批處理計(jì)算。
SparkSQL:基于SparkCore之上,提供結(jié)構(gòu)化數(shù)據(jù)的處理模塊。SparkSQL支持以SQL語言對數(shù)據(jù)進(jìn)處理,SparkSQL本身針對離線計(jì)算場景。同時(shí)基于SparkSQL,Spark提供了StructuredStreaming模塊,可以以SparkSQL為基礎(chǔ),進(jìn)行數(shù)據(jù)的流式計(jì)算。
SparkStreaming:以SparkCore為基礎(chǔ),提供數(shù)據(jù)的流式計(jì)算功能。
MLlib:以SparkCore為基礎(chǔ),進(jìn)行機(jī)器學(xué)習(xí)計(jì)算,內(nèi)置了大量的機(jī)器學(xué)習(xí)庫和API算法等。方便用戶以分布式計(jì)算的模式進(jìn)行機(jī)器學(xué)習(xí)計(jì)算。
GraphX:以SparkCore為基礎(chǔ),進(jìn)行圖計(jì)算,提供了大量的圖計(jì)算API,方便用于以分布式計(jì)算模式進(jìn)行圖計(jì)算。
Spark提供多種運(yùn)行模式,包括:
本地模式就是以一個(gè)獨(dú)立的進(jìn)程,通過其內(nèi)部的多個(gè)線程來模擬整個(gè)Spark運(yùn)行時(shí)環(huán)境
Spark中的各個(gè)角色以獨(dú)立進(jìn)程的形式存在,并組成Spark集群環(huán)境
Spark中的各個(gè)角色運(yùn)行在YARN的容器內(nèi)部,并組成Spark集群環(huán)境
Spark中的各個(gè)角色運(yùn)行在Kubernetes的容器內(nèi)部,并組成Spark集群環(huán)境
1024首播|39歲程序員逆襲記:不被年齡定義,AI浪潮里再迎春天
2025-10-241024程序員節(jié)丨10年同行,致敬用代碼改變世界的你
2025-10-24【AI設(shè)計(jì)】北京143期畢業(yè)僅36天,全員拿下高薪offer!黑馬AI設(shè)計(jì)連續(xù)6期100%高薪就業(yè)
2025-09-19【跨境電商運(yùn)營】深圳跨境電商運(yùn)營畢業(yè)22個(gè)工作日,就業(yè)率91%+,最高薪資達(dá)13500元
2025-09-19【AI運(yùn)維】鄭州運(yùn)維1期就業(yè)班,畢業(yè)14個(gè)工作日,班級93%同學(xué)已拿到Offer, 一線均薪資 1W+
2025-09-19【AI鴻蒙開發(fā)】上海校區(qū)AI鴻蒙開發(fā)4期5期,距離畢業(yè)21天,就業(yè)率91%,平均薪資14046元
2025-09-19