دادههای گمشده در پروژههای صنعتی بسیار رایجاند و باید قبل از تحلیل رفع شوند. روشهای ساده شامل جایگزینی با میانگین یا مد هستند. در روشهای پیشرفتهتر از مدلهای رگرسیونی برای برآورد مقادیر استفاده میشود. انتخاب روش مناسب بستگی به نوع داده دارد. اگر بخش زیادی از داده گم شده باشد، حذف آن بخش ممکن است منطقیتر باشد. این تصمیم باید با بررسی تأثیر بر دقت مدل انجام شود.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
