اگر مدل همگرا نمیشود، معماری، داده یا نرخ یادگیری را بررسی کن. Initialization نادرست وزنها نیز میتواند دلیل باشد. از He یا Xavier initialization استفاده کن تا گرادیانها در طول آموزش پایدار بمانند.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
