Halo, Habr! Untuk mengantisipasi dimulainya kursus "Ecosystem Hadoop, Spark, Hive" kami telah menyiapkan terjemahan dari artikel yang berguna untuk Anda. Kami juga menawarkan Anda untuk menonton rekaman gratis dari pelajaran demo tentang topik: "Spark 3.0: What's New?" ...
(executor) - , (.. ) (node) . , EC2 . r5.4xlarge, , AWS EC2, 16 .
(job), (Cluster Manager). 16 . , Spark , 15 .

, , , , (core) Spark . (X * Y = 15), , , 15 Spark :

.

, , - 15 . , , , , , (64 +), . .

, β 15 , . , , , . , . .

10% 384 MB ( , ). big data , Qubole, , . , Β«EnvironmentsΒ» Spark spark.executor.memoryOverhead.
Spark , . , , , . , , .

, . Spark , 5 β . , , , . , . , .
--executor-cores 5β , . , , . , β . , EC2 , , , . r5.4xlarge AWS , 128 .


, 112 .
, 112 , . , 3. .
( Qubole), . (112/3) = 37β2,3 = 34,7 = 34.
Spark , . (112/3) = 37 / 1,1 = 33,6 = 33.
Qubole.
--executor-memory 34G, Spark . . , Spark Spark. , , , . , , 2, . , , , β , .
, , EC2, . , , .
. , , 5.
, , , . , - , 15 , , , . 3, .
. . , 3, 16- , , 14 . !
, , , 3 , .
--num-executors (3x - 1)4 , .
data- . AWS , . , .
--driver-memory 34G, , , . 2 , (3x - 2), .
. , , 500 Spark, , . . , , .
--driver-cores 5?
, , 16 128 , .
--driver-memory 34G --executor-memory 34G --num-executors (3x - 1) --executor-cores 5:
β , .
, . . , , , .
, , Expedia Group β’, . , , , .
, , . ? ? , , ? - ? 4: Β« Apache Spark Β».