سیستم طبقه‌بندی یادگیری

از ویکی‌پدیا، دانشنامهٔ آزاد
تصور دوبعدی قوانین LCS، تقریب زدن یک تابع سه بعدی را آموزش می‌دهد. هر بیضی آبی نشان دهنده یک قانون جداگانه است که بخشی از فضای راه حل را پوشش می‌دهد. (برگرفته از تصاویر گرفته شده از XCSF[۱] با اجازه مارتین بوتز)

سیستم‌های طبقه‌بندی یادگیری، یا LCS، الگویی از روش‌های یادگیری ماشین مبتنی بر قانون هستند که یک مولفه اکتشاف (برای مثال یک الگوریتم ژنتیک) را با یک مولفه یادگیری (انجام یادگیری نظارت شده، یادگیری تقویتی یا یادگیری نظارت نشده) ترکیب می‌کنند.[۲] سیستم‌های طبقه بندی یادگیری به دنبال شناسایی مجموعه ای از قوانین وابسته به متن هستند که در مجموع، اطلاعات را به صورت تکه ای ذخیره می‌کنند و به کار می‌برند تا محاسبات را انجام دهند (مانند مدل‌سازی رفتار،[۳] طبقه‌بندی،[۴][۵] داده کاوی،[۵]رگرسیون، تقریب تابع،[۶] یا استراتژی بازی). این روش اجازه می‌دهد تا فضاهای راه حل پیچیده به بخش‌های کوچکتر و ساده‌تر تقسیم شوند.

مفاهیم بنیادیِ پشت سیستم‌های طبقه‌بندی یادگیری، ناشی از تلاش‌هایی برای مدل‌سازی سیستم‌های تطبیقی پیچیده، با استفاده از عناصر مبتنی بر قانون برای تشکیل یک سیستم شناختی مصنوعی (یعنی هوش مصنوعی) است.

روش‌شناسی[ویرایش]

معماری و اجزای یک سیستم طبقه بندی یادگیری معین، می‌تواند کاملاً تغییرپذیر باشد. کاربردی است که LCS را به عنوان یک ماشین، شامل چندین اجزای در حال تعامل در نظر بگیریم. ممکن است اجزاء اضافه یا حذف بشوند، یا اجزای موجود اصلاح یا تعویض شوند تا نیازهای دامنه یک مسئله مشخص را پوشش بدهند (مثل بلوک‌های ساختمان الگوریتمی) یا برای اینکه الگوریتم را به اندازه کافی انعطاف‌پذیر کنند تا در بسیاری از دامنه‌های مختلف مسئله کار کند. در نتیجه، الگوی LCS می‌تواند به شکل انعطاف‌پذیری در بسیاری از دامنه‌های مسئله، که خواستار یادگیری ماشین هستند، به کار برده شود. تقسیمات عمده بین پیاده‌سازی‌های LCS به شرح زیر است: (۱) معماری به سبک میشیگان در مقابل معماری به سبک پیتسبورگ،[۷] (2) یادگیری تقویتی در مقابل یادگیری تحت نظارت، (۳) یادگیری افزایشی در مقابل یادگیری دسته ای، (۴) یادگیری آنلاین در مقابل یادگیری آفلاین، (۵) آماده‌سازی مبتنی بر قدرت در مقابل

آماده‌سازی مبتنی بر دقت و (۶) نقشه عملیات کامل در مقابل بهترین نقشه عملیات. این تقسیم‌بندی‌ها لزوماً متقابل نیستند. به عنوان مثال، XCS,[۸] شناخته شده‌ترین و بهترین الگوریتم LCS مورد مطالعه، که به سبک میشیگان است. برای یادگیری تقویتی طراحی شده بود، اما می‌تواند یادگیری تحت نظارت را نیز انجام دهد، یادگیری افزایشی را که می‌تواند آنلاین یا آفلاین باشد اعمال کند، آماده‌سازی مبتنی بر دقت را اعمال کند و به دنبال ایجاد یک نقشه عملیات کامل باشد.

عناصر یک الگوریتم کلی LCS[ویرایش]

یک شماتیک گام به گام، که چرخه کلی سیستم طبقه بندی یادگیری به سبک میشیگان را نشان می‌دهد که یادگیری نظارت شده را انجام می‌دهد.

بخاطر داشته باشید که LCS بیشتر از اینکه یک روش خاص باشد، الگویی برای یادگیری ماشین مبتنی بر ژنتیک است. موارد زیر عناصر کلیدی یک الگوریتم LCS کلی و مدرن (یعنی پس از XCS) را شرح می‌دهد. برای سادگی، اجازه دهید روی معماری به سبک میشیگان با یادگیری نظارت شده تمرکز کنیم. تصاویر سمت راست را ببینید که مراحل پی در پی مربوط به این نوع LCS کلی را نشان می‌دهد.

محیط[ویرایش]

محیط، منبع داده‌هایی است که LCS با آن یادمی‌گیرد. این می‌تواند یک مجموعه داده آموزشی محدود و آفلاین (مشخصه یک مسئله داده کاوی، طبقه‌بندی، یا رگرسیون) یا یک جریان متوالی آنلاین از نمونه‌های آموزش زنده باشد. فرض شده‌است که هر نمونه آموزشی شامل تعدادی ویژگی (که به عنوان ویژگی ها یا متغیرهای مستقل نیز گفته می‌شود) و یک نقطه نهایی مورد توجه (که به عنوان کلاس، اقدام، فنوتیپ، محاسبات یا متغیر وابسته نیز گفته می‌شود) است. قسمتی از یادگیری LCS می‌تواند شامل انتخاب ویژگی باشد، پس احتیاجی نیست همهٔ ویژگی‌های داده‌های آموزشی، آموزنده باشند. مجموعه مقادیر ویژگی یک نمونه، عموماً به عنوان حالت شناخته می‌شود. برای سادگی، یک دامنه مسئله فرضی را با ویژگی‌های بولیین / باینری و یک کلاس بولیین / باینری فرض کنیم. برای سیستم‌های سبک میشیگان، یک نمونه از محیط در هر چرخه یادگیری (یعنی یادگیری افزایشی) آموزش داده می‌شود. سیستم‌های به سبک پیتسبورگ در جایی که مجموعه‌های قوانین در هر تکرار بر روی بیشتر یا همهٔ داده‌های آموزشی سنجیده می‌شوند، یادگیری دسته‌ای انجام می‌دهند.

قاعده / طبقه بندی / جمعیت[ویرایش]

یک قانون، یک رابطه وابسته به متن بین مقادیر حالت و برخی محاسبات است. قوانین معمولاً به شکل یک عبارت {اگر:آنگاه} هستند (مثلاً { اگر 'شرط' آنگاه 'اقدام کن'}، یا به عنوان مثال خاص تر، {اگر 'قرمز ' و 'هشت ضلعی' آنگاه 'علامت توقف'}). یک مفهوم مهم در LCS و یادگیری ماشین مبتنی بر قانون به‌طور یکسان، این است که یک قانون اختصاصی به خودی خود یک مدل نیست، زیرا این قانون تنها زمانی قابل اجرا است که شرایط آن برآورده شود. یک قانون را به عنوان یک «مدل محلی» از فضای راه حل در نظر بگیرید.

منابع[ویرایش]

  1. Stalph, Patrick O.; Butz, Martin V. (2010-02-01). "JavaXCSF: The XCSF Learning Classifier System in Java". SIGEVOlution. 4 (3): 16–19. doi:10.1145/1731888.1731890. ISSN 1931-8499.
  2. Urbanowicz, Ryan J.; Moore, Jason H. (2009-09-22). "Learning Classifier Systems: A Complete Introduction, Review, and Roadmap". Journal of Artificial Evolution and Applications (به انگلیسی). 2009: 1–25. doi:10.1155/2009/736398. ISSN 1687-6229.
  3. Dorigo, Marco (1995). "Alecsys and the AutonoMouse: Learning to control a real robot by distributed classifier systems". Machine Learning (به انگلیسی). 19 (3): 209–240. doi:10.1007/BF00996270. ISSN 0885-6125.
  4. Bernadó-Mansilla, Ester; Garrell-Guiu, Josep M. (2003-09-01). "Accuracy-Based Learning Classifier Systems: Models, Analysis and Applications to Classification Tasks". Evolutionary Computation. 11 (3): 209–238. doi:10.1162/106365603322365289. ISSN 1063-6560. PMID 14558911.
  5. ۵٫۰ ۵٫۱ Urbanowicz, Ryan J.; Moore, Jason H. (2015-04-03). "ExSTraCS 2.0: description and evaluation of a scalable learning classifier system". Evolutionary Intelligence (به انگلیسی). 8 (2–3): 89–116. doi:10.1007/s12065-015-0128-8. ISSN 1864-5909. PMC 4583133. PMID 26417393.
  6. Butz, M. V.; Lanzi, P. L.; Wilson, S. W. (2008-06-01). "Function Approximation With XCS: Hyperellipsoidal Conditions, Recursive Least Squares, and Compaction". IEEE Transactions on Evolutionary Computation. 12 (3): 355–376. doi:10.1109/TEVC.2007.903551. ISSN 1089-778X.
  7. Introducing Rule-Based Machine Learning: A Practical Guide, Ryan J. Urbanowicz and Will Browne, see pp. 72-73 for Michigan-style architecture vs. Pittsburgh-style architecture.
  8. Wilson, Stewart W. (1995-06-01). "Classifier Fitness Based on Accuracy". Evol. Comput. 3 (2): 149–175. CiteSeerX 10.1.1.363.2210. doi:10.1162/evco.1995.3.2.149. ISSN 1063-6560.