Konfigurasi ekonomis dari pelaksana Apache Spark

Halo, Habr! Untuk mengantisipasi dimulainya kursus "Ecosystem Hadoop, Spark, Hive" kami telah menyiapkan terjemahan dari artikel yang berguna untuk Anda. Kami juga menawarkan Anda untuk menonton rekaman gratis dari pelajaran demo tentang topik: "Spark 3.0: What's New?" ...


(executor) - , (.. ) (node) . , EC2 . r5.4xlarge, , AWS EC2, 16 .

(job), (Cluster Manager). 16 . , Spark , 15 .

, , , , (core) Spark . (X * Y = 15), , , 15 Spark :

Konfigurasi pelaksana yang mungkin

.

, , - 15 . , , , , , (64 +), . .

, β€” 15 , . , , , . , . .

10% 384 MB ( , ). big data , Qubole, , . , Β«EnvironmentsΒ» Spark spark.executor.memoryOverhead.

Spark , . , , , . , , .

, . Spark , 5 β€” . , , , . , . , .

--executor-cores 5

β€” , . , , . , β€” . , EC2 , , , . r5.4xlarge AWS , 128 .

128 , . , YARN , .

, 112 .

, 112 , . , 3. .

( Qubole), . (112/3) = 37–2,3 = 34,7 = 34.

Spark , . (112/3) = 37 / 1,1 = 33,6 = 33.

Qubole.

--executor-memory 34G

, Spark . . , Spark Spark. , , , . , , 2, . , , , β€” , .

, , EC2, . , , .

, , . , , , , .

. , , 5.

, , , . , - , 15 , , , . 3, .

. . , 3, 16- , , 14 . !

, , , 3 , .

--num-executors (3x - 1)

4 , .

data- . AWS , . , .

--driver-memory 34G

, , , . 2 , (3x - 2), .

. , , 500 Spark, , . . , , .

--driver-cores 5

?

, , 16 128 , .

--driver-memory 34G --executor-memory 34G --num-executors (3x - 1) --executor-cores 5

:

β€” , .

, . . , , , .

, , Expedia Group β„’, . , , , .

, , . ? ? , , ? - ? 4: Β« Apache Spark Β».


" Hadoop, Spark, Hive" . "Spark 3.0: ?".

:




All Articles