vanishing gradient چیست؟

AUتحریریه
۱۴۰۴/۰۷/۱۲
6 دقیقه مطالعه
در شبکه‌های عمیق، گاهی گرادیان‌ها در لایه‌های اولیه خیلی کوچک می‌شوند و آموزش متوقف می‌شود. این پدیده vanishing gradient نام دارد. استفاده از توابع فعال‌سازی ReLU و نرمال‌سازی batch normalization کمک زیادی می‌کند.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
راهنمای خطاهای رایج در آموزش مدل‌های یادگیری عمیق
مقدمه
حتی حرفه‌ای‌ترین توسعه‌دهندگان هم هنگام آموزش مدل‌های یادگیری عمیق با خطاهایی مثل overfitting، vanishing gradient و عدم همگرایی روبه‌رو می‌شوند. این کتابچه بهت کمک می‌کند این مشکلات را شناسایی و رفع کنی تا مدل‌هایت سریع‌تر و دقیق‌تر یاد بگیرند.
دسترسی سریع پس از خرید

دسترسی سریع پس از خرید