چه زمانی باید داده‌های گمشده حذف شوند؟

AUتحریریه
۱۴۰۴/۰۷/۱۲
6 دقیقه مطالعه
اگر درصد زیادی از یک ویژگی گم شده باشد (مثلاً بالای ۶۰٪)، معمولاً حذف آن ویژگی منطقی‌تر است. همچنین اگر داده‌های گمشده تصادفی نیستند و الگوی خاصی دارند، جایگزینی ممکن است نتیجه را خراب کند. باید تعادل بین دقت مدل و حجم داده حفظ شود. گزارش تصمیم حذف باید مستند شود تا در تحلیل‌های بعدی قابل پیگیری باشد.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
راهنمای رفع داده‌های گمشده و نویزی در Big Data
مقدمه
در این کتابچه یاد می‌گیرید چگونه داده‌های ناقص و نویزی را در پروژه‌های کلان‌داده شناسایی و اصلاح کنید تا تحلیل‌هایتان دقیق‌تر و پایدارتر شوند.
دسترسی سریع پس از خرید

دسترسی سریع پس از خرید