چطور پارامترهای آموزش را تنظیم کنیم؟

AUتحریریه

۱۴۰۴/۰۷/۱۲

6 دقیقه مطالعه

پارامترهایی مثل نرخ یادگیری، ضریب تخفیف (gamma) و نرخ اکتشاف تأثیر زیادی بر نتیجه دارند. انتخاب نادرست ممکن است باعث نوسان یا کندی یادگیری شود. تنظیم این پارامترها معمولاً با آزمون و خطا یا الگوریتم‌های بهینه‌سازی انجام می‌شود. استفاده از grid search یا Bayesian optimization توصیه می‌شود. هدف رسیدن به تعادل میان یادگیری سریع و پایداری است.

برای مشاهدهٔ ادامه، خرید کنید

دسترسی سریع و فوری

راهنمای استفاده از یادگیری تقویتی در کنترل فرآیند

مقدمه

در این کتابچه با اصول و کاربرد یادگیری تقویتی (Reinforcement Learning) در کنترل خودکار فرآیندهای صنعتی آشنا می‌شوید و یاد می‌گیرید چگونه عملکرد سیستم‌ها را با تصمیم‌گیری هوشمند بهبود دهید.

فهرست