Apache Spark با پردازش موازی دادهها در حافظه، سرعت اجرای pipelineهای حجیم را چندین برابر افزایش میدهد. برای تحلیلهای بلادرنگ و batch بسیار مناسب است.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
راهنمای انتخاب ابزارهای زیرساختی در مهندسی داده (Airflow، Spark، dbt، Kafka و...)
مقدمه
این کتابچه برای تیمهای فنی طراحی شده تا با شناخت مزایا، معایب و کاربرد ابزارهای کلیدی مهندسی داده، بتوانند بهترین ترکیب ابزار را برای پروژههای خود انتخاب کنند.