Spark از فرمتهای متعددی مثل CSV، JSON، Parquet و ORC پشتیبانی میکند. با دستور spark.read.csv یا spark.read.parquet میتوانید دادهها را بارگذاری کنید. برای دادههای بزرگ بهتر است از پارامتر inferSchema=False برای افزایش سرعت استفاده کنید. همچنین میتوانید دادهها را از دیتابیس با JDBC بارگذاری کنید.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
