برای افزایش سرعت میتوانید از cache و persist برای نگهداری دادهها در حافظه استفاده کنید. همچنین تعداد پارتیشنها را متناسب با اندازه داده تنظیم کنید. استفاده از Broadcast Join به جای Join معمولی در دادههای نامتوازن بسیار مؤثر است. مانیتورینگ در UI Spark نیز کمک میکند گلوگاهها شناسایی شوند.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
