یادگیری تقویتی شاخهای از هوش مصنوعی است که در آن عامل (Agent) از طریق تعامل با محیط و دریافت پاداش یا جریمه یاد میگیرد تصمیم بگیرد. در محیطهای صنعتی، عامل میتواند کنترلکنندهای باشد که دمای کوره یا سرعت نوار نقاله را تنظیم میکند. هدف این است که با آزمون و خطا، سیاستی پیدا کند که بهترین عملکرد را داشته باشد. این روش مشابه یادگیری انسان از تجربه است.
برای مشاهدهٔ ادامه، خرید کنید
دسترسی سریع و فوری
