RDD ساختار اصلی داده در Spark است که انعطاف زیادی دارد اما نوشتن کوئری با آن سختتر است. DataFrame نسخه ساختاریافتهتر است که با SQL قابل کوئری گرفتن است. DataFrameها سریعترند چون از Catalyst Optimizer برای بهینهسازی استفاده میکنند. بهتر است برای کارهای تحلیلی از DataFrame استفاده شود.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
