چطور پارامترهای آموزش را تنظیم کنیم؟

AUتحریریه
۱۴۰۴/۰۷/۱۲
6 دقیقه مطالعه
پارامترهایی مثل نرخ یادگیری، ضریب تخفیف (gamma) و نرخ اکتشاف تأثیر زیادی بر نتیجه دارند. انتخاب نادرست ممکن است باعث نوسان یا کندی یادگیری شود. تنظیم این پارامترها معمولاً با آزمون و خطا یا الگوریتم‌های بهینه‌سازی انجام می‌شود. استفاده از grid search یا Bayesian optimization توصیه می‌شود. هدف رسیدن به تعادل میان یادگیری سریع و پایداری است.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
راهنمای استفاده از یادگیری تقویتی در کنترل فرآیند
مقدمه
در این کتابچه با اصول و کاربرد یادگیری تقویتی (Reinforcement Learning) در کنترل خودکار فرآیندهای صنعتی آشنا می‌شوید و یاد می‌گیرید چگونه عملکرد سیستم‌ها را با تصمیم‌گیری هوشمند بهبود دهید.
دسترسی سریع پس از خرید

دسترسی سریع پس از خرید