vanishing gradient چیست؟

AUتحریریه

۱۴۰۴/۰۷/۱۲

6 دقیقه مطالعه

در شبکه‌های عمیق، گاهی گرادیان‌ها در لایه‌های اولیه خیلی کوچک می‌شوند و آموزش متوقف می‌شود. این پدیده vanishing gradient نام دارد. استفاده از توابع فعال‌سازی ReLU و نرمال‌سازی batch normalization کمک زیادی می‌کند.

برای مشاهدهٔ ادامه، خرید کنید

دسترسی سریع و فوری

راهنمای خطاهای رایج در آموزش مدل‌های یادگیری عمیق

مقدمه

حتی حرفه‌ای‌ترین توسعه‌دهندگان هم هنگام آموزش مدل‌های یادگیری عمیق با خطاهایی مثل overfitting، vanishing gradient و عدم همگرایی روبه‌رو می‌شوند. این کتابچه بهت کمک می‌کند این مشکلات را شناسایی و رفع کنی تا مدل‌هایت سریع‌تر و دقیق‌تر یاد بگیرند.

فهرست