Spark از یک درایور (Driver) و چندین نود اجرایی (Executor) تشکیل شده است. درایور وظیفه هماهنگی وظایف را دارد و نودها داده را پردازش میکنند. دادهها در قالب RDD یا DataFrame بین نودها توزیع میشوند. وجود SparkContext و Cluster Manager برای مدیریت منابع ضروری است. این معماری توزیعشده باعث مقیاسپذیری بالای Spark میشود.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
