کنترل یادگیری ماشین

کنترل یادگیری ماشین (MLC) زیرشاخه‌ای از یادگیری ماشین، تئوری و کنترل هوشمند است که مسائل کنترل بهینه را با روش‌های یادگیری ماشین حل می‌کند. کاربردهای کلیدی سیستم‌های غیرخطی پیچیده‌ای هستند که روش‌های تئوری کنترل خطی برای آنها قابل اجرا نیستند.

انواع مشکلات و وظایف[ویرایش]

چهار نوع مشکل معمولاً با آن مواجه می‌شوند.

شناسایی پارامتر کنترل: اگر ساختار قانون کنترل داده شود اما پارامترها ناشناخته باشند، MLC به شناسایی پارامتر^[۱] ترجمه می‌شود. یک مثال الگوریتم ژنتیک برای بهینه‌سازی ضرایب یک کنترل‌کننده PID^[۲] یا کنترل بهینه زمان گسسته‌است.^[۳]
طراحی کنترل به عنوان مسئله رگرسیون از نوع اول: MLC یک نگاشت غیرخطی کلی از سیگنال‌های حسگر تا دستورات تحریک را تقریب می‌زند، در صورتی که سیگنال‌های حسگر و فرمان بهینه تحریک برای هر حالت شناخته شده باشند. یک مثال محاسبه بازخورد حسگر از بازخورد وضعیت کامل شناخته شده‌است. یک شبکه عصبی معمولاً برای این کار استفاده می‌شود.^[۴]
طراحی کنترل به عنوان مشکل رگرسیونی از نوع دوم: MLC همچنین ممکن است قوانین کنترل غیرخطی دلخواه را شناسایی کند که تابع هزینه نیروگاه را به حداقل می‌رساند. در این مورد، نه یک مدل، نه ساختار قانون کنترل، و نه فرمان بهینه‌سازی محرک نیازی به شناخته شدن نیست. بهینه‌سازی تنها بر اساس عملکرد کنترل (تابع هزینه) است که در کارخانه اندازه‌گیری می‌شود. برنامه‌ریزی ژنتیکی یک تکنیک رگرسیون قدرتمند برای این منظور است.^[۵]
کنترل یادگیری تقویتی: قانون کنترل ممکن است به‌طور مداوم در مورد تغییرات عملکرد اندازه‌گیری شده (پاداش) با استفاده از یادگیری تقویتی به روز شود.^[۶]

به عنوان مثال، MLC شامل کنترل شبکه عصبی، کنترل مبتنی بر الگوریتم ژنتیک، کنترل برنامه‌ریزی ژنتیک، کنترل یادگیری تقویتی است و دارای همپوشانی روش‌شناسی با سایر کنترل‌های مبتنی بر داده، مانند هوش مصنوعی و کنترل ربات است.

برنامه‌های کاربردی[ویرایش]

MLC با موفقیت برای بسیاری از مسائل کنترل غیرخطی، کاوش مکانیسم‌های تحریک ناشناخته و اغلب غیرمنتظره اعمال شده‌است. کاربردهای مثال عبارتند از:

کنترل نگرش ماهواره‌ها^[۷]
کنترل حرارتی ساختمان^[۸]
کنترل آشفتگی بازخورد.^[۹]^[۱۰]
وسایل نقلیه زیر آب که از راه دور کار می‌کنند.^[۱۱]
بسیاری از کاربردهای مهندسی MLC در مقاله مروری PJ Fleming & RC Purshouse (2002) خلاصه شده‌است.^[۱۲]

همان‌طور که برای همه روش‌های غیرخطی عمومی، MLC برای طیف وسیعی از شرایط عملیاتی هیچ هم‌گرایی، بهینه یا استحکام تضمین‌شده‌ای ندارد.

منابع[ویرایش]

↑ Thomas Bäck & Hans-Paul Schwefel (Spring 1993) "An overview of evolutionary algorithms for parameter optimization", Journal of Evolutionary Computation (MIT Press), vol. 1, no. 1, pp. 1-23
↑ N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J. -P. Bonnet & E. Moreau, (2015) "Multi-Input Genetic Algorithm for Experimental Optimization of the Reattachment Downstream of a Backward-Facing Step with Surface Plasma Actuator", Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
↑ Zbigniew Michalewicz, Cezary Z. Janikow & Jacek B. Krawczyk (July 1992) "A modified genetic algorithm for optimal control problems", [Computers & Mathematics with Applications], vol. 23, no 12, pp. 83-94.
↑ C. Lee, J. Kim, D. Babcock & R. Goodman (1997) "Application of neural networks to turbulence control for drag reduction", Physics of Fluids, vol. 6, no. 9, pp. 1740-1747
↑ D. C. Dracopoulos & S. Kent (December 1997) "Genetic programming for prediction and control", Neural Computing & Applications (Springer), vol. 6, no. 4, pp. 214-228.
↑ Andrew G. Barto (December 1994) "Reinforcement learning control", Current Opinion in Neurobiology, vol. 6, no. 4, pp. 888–893
↑ Dimitris. C. Dracopoulos & Antonia. J. Jones (1994) Neuro-genetic adaptive attitude control, Neural Computing & Applications (Springer), vol. 2, no. 4, pp. 183-204.
↑ Jonathan A. Wright, Heather A. Loosemore & Raziyeh Farmani (2002) "Optimization of building thermal design and control by multi-criterion genetic algorithm, [Energy and Buildings], vol. 34, no. 9, pp. 959-972.
↑ N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J. -P. Bonnet & E. Moreau, (2015) "Multi-Input Genetic Algorithm for Experimental Optimization of the Reattachment Downstream of a Backward-Facing Step with Surface Plasma Actuator", Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.
↑ Steven J. Brunton & Bernd R. Noack (2015) Closed-loop turbulence control: Progress and challenges, Applied Mechanics Reviews, vol. 67, no. 5, article 050801, pp. 1-48.
↑ J. Javadi-Moghaddam, & A. Bagheri (2010 "An adaptive neuro-fuzzy sliding mode based genetic algorithm control system for under water remotely operated vehicle", Expert Systems with Applications, vol. 37 no. 1, pp. 647-660.
↑ Peter J. Fleming, R. C. Purshouse (2002 "Evolutionary algorithms in control systems engineering: a survey" Control Engineering Practice, vol. 10, no. 11, pp. 1223-1241

[Baeck19932-1] Thomas Bäck & Hans-Paul Schwefel (Spring 1993) "An overview of evolutionary algorithms for parameter optimization", Journal of Evolutionary Computation (MIT Press), vol. 1, no. 1, pp. 1-23

[Benard2015aiaa2-2] N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J. -P. Bonnet & E. Moreau, (2015) "Multi-Input Genetic Algorithm for Experimental Optimization of the Reattachment Downstream of a Backward-Facing Step with Surface Plasma Actuator", Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.

[3] Zbigniew Michalewicz, Cezary Z. Janikow & Jacek B. Krawczyk (July 1992) "A modified genetic algorithm for optimal control problems", [Computers & Mathematics with Applications], vol. 23, no 12, pp. 83-94.

[4] C. Lee, J. Kim, D. Babcock & R. Goodman (1997) "Application of neural networks to turbulence control for drag reduction", Physics of Fluids, vol. 6, no. 9, pp. 1740-1747

[5] D. C. Dracopoulos & S. Kent (December 1997) "Genetic programming for prediction and control", Neural Computing & Applications (Springer), vol. 6, no. 4, pp. 214-228.

[6] Andrew G. Barto (December 1994) "Reinforcement learning control", Current Opinion in Neurobiology, vol. 6, no. 4, pp. 888–893

[7] Dimitris. C. Dracopoulos & Antonia. J. Jones (1994) Neuro-genetic adaptive attitude control, Neural Computing & Applications (Springer), vol. 2, no. 4, pp. 183-204.

[8] Jonathan A. Wright, Heather A. Loosemore & Raziyeh Farmani (2002) "Optimization of building thermal design and control by multi-criterion genetic algorithm, [Energy and Buildings], vol. 34, no. 9, pp. 959-972.

[Benard2015aiaa-9] N. Benard, J. Pons-Prats, J. Periaux, G. Bugeda, J. -P. Bonnet & E. Moreau, (2015) "Multi-Input Genetic Algorithm for Experimental Optimization of the Reattachment Downstream of a Backward-Facing Step with Surface Plasma Actuator", Paper AIAA 2015-2957 at 46th AIAA Plasmadynamics and Lasers Conference, Dallas, TX, USA, pp. 1-23.

[10] Steven J. Brunton & Bernd R. Noack (2015) Closed-loop turbulence control: Progress and challenges, Applied Mechanics Reviews, vol. 67, no. 5, article 050801, pp. 1-48.

[11] J. Javadi-Moghaddam, & A. Bagheri (2010 "An adaptive neuro-fuzzy sliding mode based genetic algorithm control system for under water remotely operated vehicle", Expert Systems with Applications, vol. 37 no. 1, pp. 647-660.

[12] Peter J. Fleming, R. C. Purshouse (2002 "Evolutionary algorithms in control systems engineering: a survey" Control Engineering Practice, vol. 10, no. 11, pp. 1223-1241

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

[۷]

[۸]

[۹]

[۱۰]

[۱۱]

[۱۲]