چطور داده‌های پرت را مدیریت کنیم؟

AUتحریریه
۱۴۰۴/۰۷/۱۲
6 دقیقه مطالعه
داده‌های پرت (outliers) می‌توانند به میانگین‌ها و مدل‌ها آسیب بزنند. برای شناسایی آن‌ها از نمودار boxplot یا روش‌های آماری مثل Z-score استفاده کنید. بسته به نوع داده، می‌توانید داده‌های پرت را حذف، محدود یا جایگزین کنید. همیشه قبل از اقدام، بررسی کنید آیا داده پرت نتیجه خطاست یا الگوی واقعی را نشان می‌دهد. رویکرد محتاطانه بهترین گزینه است.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
راهنمای گام‌به‌گام پاکسازی داده‌های حجیم
مقدمه
در این کتابچه یاد می‌گیرید چطور داده‌های خام و نامرتب را به داده‌های قابل‌اعتماد برای تحلیل تبدیل کنید تا مدل‌های یادگیری ماشین شما خروجی دقیق‌تری داشته باشند.
دسترسی سریع پس از خرید

دسترسی سریع پس از خرید