آتاماتای یادگیر

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

یک آتاماتای یادگیر را می‌توان بصورت یک شئ مجرد که دارای تعداد متناهی عمل است، در نظر گرفت. آتاماتای یادگیر با انتخاب یک عمل از مجموعه عملهای خود و اِعمال آن بر محیط، عمل می‌کند. عمل مذکور توسط یک محیط تصادفی ارزیابی می‌شود و آتاماتا از پاسخ محیط برای انتخاب عمل بعدی خود استفاده می‌کند. در طی این فرایند آتاماتا یاد می‌گیرد که عمل بهینه را انتخاب نماید. نحوه استفاده از پاسخ محیط به عمل انتخابی آتاماتا که در جهت انتخاب عمل بعدی آتاماتا استفاده می‌شود، توسط الگوریتم یادگیری آتاماتا مشخص می‌گردد.