اگر نرخ یادگیری خیلی زیاد باشد، مدل نوسان دارد و همگرا نمیشود؛ اگر خیلی کم باشد، آموزش کند میشود. معمولاً مقادیر 0.001 یا 0.0001 برای Adam انتخاب خوبی است. میتوانی با ابزار Learning Rate Finder بهترین مقدار را بیابی.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
