دادههای ناهنجار (Outliers) میتوانند ناشی از خطا یا رویداد خاص باشند. برای شناسایی آنها میتوان از نمودارهای Box Plot یا الگوریتمهایی مثل Isolation Forest استفاده کرد. در برخی موارد، این دادهها ارزشمند و نشاندهنده خرابی احتمالی هستند. بنابراین باید قبل از حذف، علت آنها بررسی شود. برخورد صحیح با ناهنجاریها باعث افزایش دقت مدلهای بعدی میشود.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
