کنترل یادگیری ماشین
کنترل یادگیری ماشین (MLC) زیرشاخهای از یادگیری ماشین، تئوری و کنترل هوشمند است که مسائل کنترل بهینه را با روشهای یادگیری ماشین حل میکند. کاربردهای کلیدی سیستمهای غیرخطی پیچیدهای هستند که روشهای تئوری کنترل خطی برای آنها قابل اجرا نیستند.
انواع مشکلات و وظایف[ویرایش]
چهار نوع مشکل معمولاً با آن مواجه میشوند.
- شناسایی پارامتر کنترل: اگر ساختار قانون کنترل داده شود اما پارامترها ناشناخته باشند، MLC به شناسایی پارامتر[۱] ترجمه میشود. یک مثال الگوریتم ژنتیک برای بهینهسازی ضرایب یک کنترلکننده PID[۲] یا کنترل بهینه زمان گسستهاست.[۳]
- طراحی کنترل به عنوان مسئله رگرسیون از نوع اول: MLC یک نگاشت غیرخطی کلی از سیگنالهای حسگر تا دستورات تحریک را تقریب میزند، در صورتی که سیگنالهای حسگر و فرمان بهینه تحریک برای هر حالت شناخته شده باشند. یک مثال محاسبه بازخورد حسگر از بازخورد وضعیت کامل شناخته شدهاست. یک شبکه عصبی معمولاً برای این کار استفاده میشود.[۴]
- طراحی کنترل به عنوان مشکل رگرسیونی از نوع دوم: MLC همچنین ممکن است قوانین کنترل غیرخطی دلخواه را شناسایی کند که تابع هزینه نیروگاه را به حداقل میرساند. در این مورد، نه یک مدل، نه ساختار قانون کنترل، و نه فرمان بهینهسازی محرک نیازی به شناخته شدن نیست. بهینهسازی تنها بر اساس عملکرد کنترل (تابع هزینه) است که در کارخانه اندازهگیری میشود. برنامهریزی ژنتیکی یک تکنیک رگرسیون قدرتمند برای این منظور است.[۵]
- کنترل یادگیری تقویتی: قانون کنترل ممکن است بهطور مداوم در مورد تغییرات عملکرد اندازهگیری شده (پاداش) با استفاده از یادگیری تقویتی به روز شود.[۶]
به عنوان مثال، MLC شامل کنترل شبکه عصبی، کنترل مبتنی بر الگوریتم ژنتیک، کنترل برنامهریزی ژنتیک، کنترل یادگیری تقویتی است و دارای همپوشانی روششناسی با سایر کنترلهای مبتنی بر داده، مانند هوش مصنوعی و کنترل ربات است.
برنامههای کاربردی[ویرایش]
MLC با موفقیت برای بسیاری از مسائل کنترل غیرخطی، کاوش مکانیسمهای تحریک ناشناخته و اغلب غیرمنتظره اعمال شدهاست. کاربردهای مثال عبارتند از:
- کنترل نگرش ماهوارهها[۷]
- کنترل حرارتی ساختمان[۸]
- کنترل آشفتگی بازخورد.[۹][۱۰]
- وسایل نقلیه زیر آب که از راه دور کار میکنند.[۱۱]
- بسیاری از کاربردهای مهندسی MLC در مقاله مروری PJ Fleming & RC Purshouse (2002) خلاصه شدهاست.[۱۲]
همانطور که برای همه روشهای غیرخطی عمومی، MLC برای طیف وسیعی از شرایط عملیاتی هیچ همگرایی، بهینه یا استحکام تضمینشدهای ندارد.
منابع[ویرایش]
- ↑ Thomas Bäck & Hans-Paul Schwefel (Spring 1993) "An overview of evolutionary algorithms for parameter optimization", Journal of Evolutionary Computation (MIT Press), vol. 1, no. 1, pp. 1-23
- ↑ N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J. -P. Bonnet & E. Moreau, (2015) "Multi-Input Genetic Algorithm for Experimental Optimization of the Reattachment Downstream of a Backward-Facing Step with Surface Plasma Actuator", Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
- ↑ Zbigniew Michalewicz, Cezary Z. Janikow & Jacek B. Krawczyk (July 1992) "A modified genetic algorithm for optimal control problems", [Computers & Mathematics with Applications], vol. 23, no 12, pp. 83-94.
- ↑ C. Lee, J. Kim, D. Babcock & R. Goodman (1997) "Application of neural networks to turbulence control for drag reduction", Physics of Fluids, vol. 6, no. 9, pp. 1740-1747
- ↑ D. C. Dracopoulos & S. Kent (December 1997) "Genetic programming for prediction and control", Neural Computing & Applications (Springer), vol. 6, no. 4, pp. 214-228.
- ↑ Andrew G. Barto (December 1994) "Reinforcement learning control", Current Opinion in Neurobiology, vol. 6, no. 4, pp. 888–893
- ↑ Dimitris. C. Dracopoulos & Antonia. J. Jones (1994) Neuro-genetic adaptive attitude control, Neural Computing & Applications (Springer), vol. 2, no. 4, pp. 183-204.
- ↑ Jonathan A. Wright, Heather A. Loosemore & Raziyeh Farmani (2002) "Optimization of building thermal design and control by multi-criterion genetic algorithm, [Energy and Buildings], vol. 34, no. 9, pp. 959-972.
- ↑ N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J. -P. Bonnet & E. Moreau, (2015) "Multi-Input Genetic Algorithm for Experimental Optimization of the Reattachment Downstream of a Backward-Facing Step with Surface Plasma Actuator", Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
- ↑ Steven J. Brunton & Bernd R. Noack (2015) Closed-loop turbulence control: Progress and challenges, Applied Mechanics Reviews, vol. 67, no. 5, article 050801, pp. 1-48.
- ↑ J. Javadi-Moghaddam, & A. Bagheri (2010 "An adaptive neuro-fuzzy sliding mode based genetic algorithm control system for under water remotely operated vehicle", Expert Systems with Applications, vol. 37 no. 1, pp. 647-660.
- ↑ Peter J. Fleming, R. C. Purshouse (2002 "Evolutionary algorithms in control systems engineering: a survey" Control Engineering Practice, vol. 10, no. 11, pp. 1223-1241