بازشناخت الگو

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

تشخیص الگو شاخه ای از مبحث یادگیری ماشینی است. می توان گفت تشخیص الگو، دریافت داده های خام و تصمیم گیری بر اساس دسته بندی داده ها است. بیشتر تحقیقات در زمینه تشخیص الگو در رابطه با "یادگیری نظارت شده" یا " یادگیری بدون نظارت " است. روش های تشخیص الگو، الگوهای مورد نظر را از یک مجموعه داده ها با استفاده از دانش قبلی در مورد الگوها یا اطلاعات آماری داده ها، جداسازی می کند. الگوهایی که با این روش دسته بندی می شوند، گروه هایی از اندازه گیری ها یا مشاهدات هستند که نقاط معینی را در یک فضای چند بعدی تشکیل می دهند. این ویژگی اختلاف عمده تشخیص الگو با تطبیق الگو است که در آنجا الگوها با استفاده از موارد کاملا دقیق و معین و بر اساس یک الگوی مشخص، تشخیص داده می شوند. تشخیص الگو و تطبیق الگو از بخش های اصلی مبحث پردازش تصویر به خصوص در زمینه بینایی ماشین هستند.

تشخیص خودکار چهره شخص با استفاده از الگوریتمهای تشخیص الگو

انواع تشخیص الگو[ویرایش]

نیاز به سیستم های اطلاعاتی بهبود یافته بیشتر از قبل مورد توجه قرار گرفته است چرا که اطلاعات عنصری اساسی در تصمیم سازی است و جهان در حال افزایش دادن مقدار اطلاعات در فرم های مختلف با درجه هایی از پیچیدگی است. یکی از مسائل اصلی در طراحی سیستم های اطلاعاتی مدرن، تشخیص الگو به طور اتوماتیک است. تشخیص به عنوان یک صفت اصلی انسان بودن است. یک الگو، توصیفی از یک شیء است. یک انسان دارای یک سیستم اطلاعاتی سطح بالاست که یک دلیل آن داشتن قابلیت تشخیص الگوی پیشرفته است. بر طبق طبیعت الگوهای مورد تشخیص، عملیات تشخیص در دو گونه ی اصلی تقسیم می شوند.

تشخیص آیتم های واقعی[ویرایش]

این ممکن است به عنوان تشخیص سنسوری معرفی شود که تشخیص الگوهای سمعی و بصری را دربر می گیرد.

تشخیص الگوهای زمانی و فضایی[ویرایش]

این فرآیند تشخیص، شناسایی و دسته بندی الگوهای فضایی و الگوهای زمانی را در بر می گیرد. مثال هایی از الگوهای فضایی کارکترها، اثر انگشت ها، اشیاء فیزیکی و تصاویر هستند. الگوهای زمانی شامل فرم های موجی گفتار، سری های زمانی و … هستند.

الگوها و کلاس های الگوها[ویرایش]

تشخیص الگو می تواند به عنوان دسته بندی داده ها ی ورودی در کلاس های شناخته شده به وسیله ی استخراج ویژگیهای مهم یا صفات داده تعریف شود. یک کلاس الگو، یک دسته ی متمایز شده به وسیله ی برخی صفات و ویژگی های مشترک است. ویژگی های یک کلاس الگو، صفات نوعی هستند که بین همه ی الگوهای متعلق به آن کلاس مشترک هستند. ویژگی هایی که تفاوت های بین کلاس های الگو را بیان می کنند اغلب به عنوان ویژگی های اینترست شناخته می شوند. یک الگو، توصیفی از یکی از اعضای دسته است که ارائه دهنده ی کلاس الگو می باشد. برای راحتی، الگوها معمولا به وسیله ی یک بردار نمایش داده می شوند. مانند :

مسائل اساسی در طراحی سیستم تشخیص الگو[ویرایش]

به طور کلی طراحی یک سیستم تشخیص الگو چندین مسئله ی اصلی را در بر میگیرد : ۱)طریقه نمایش داده ها ۲)استخراج ویژگی ۳)تعیین رویه تصمیم بهینه

طریقه نمایش داده ها[ویرایش]

اول از همه، ما بایستی در مورد نمایش داده های ورودی تصمیم بگیریم.

استخراج ویژگی[ویرایش]

دومین مسئله در تشخیص الگو، استخراج ویژگیها یا صفات خاصی از داده ی ورودی دریافته شده و کاهش ابعاد بردارهای الگوست. این مورد اغلب به عنوان مسئله ی پیش پردازش و استخراج ویژگی معرفی می شود. عناصر ویژگیهای (اینتراست ) برای همه ی کلاس های الگو مشترک هستند می توانند حذف شوند. اگر یک مجموعه ی کامل از ویژگیهای تشخیص برای هر کلاس از داده های اندازه گیری شده تعیین شود. تشخیص و دسته بندی الگوها، دشواری کمتری را در برخواهد داشت. تشخیص اتوماتیک ممکن است به یک فرآیند تطبیق ساده یا یک جدول جستجو کاهش یابد. به هر حال در بسیاری از مسائل تشخیص الگو، در عمل ، تعیین یک مجموعه کامل از ویژگیهای تشخیص اگر غیرممکن نباشد دشوار است.

تعیین رویه تصمیم بهینه[ویرایش]

مسئله ی سوم در طراحی سیستم تشخیص الگو تعیین رویه های تصمیم بهینه است که در فرآیند شناسایی و دسته بندی مورد نیاز واقع می شود. پس از آنکه داده های مشاهده شده از الگوها جمع آوری شد و در فرم نقاط الگو یا بردارهای اندازه گیری در فضای الگو بیان شد، ما ماشینی را می خواهیم تا تصمیم بگیرد که این داده به کدام کلاس الگو تعلق دارد.

یادگیری و تمرین دادن[ویرایش]

توابع تصمیم به روشهای متنوعی قابل تولید هستند. زمانی که دانش قبلی در مورد الگوهایی که بایستی تشخیص داده شوند ، موجود باشد، تابع تصمیم براساس این اطلاعات ممکن است با دقت تعیین شود. زمانی که تنها دانشی کیفی در مورد الگوها موجود باشد، حدس هایی مستدل از فرم های تابع تصمیم می توان داشت. در این مورد محدوده های تصمیم ممکن است از پاسخ صحیح دور شود. وضعیت کلی تر آنست که دانش قبلی کمی در مورد الگوهای مورد تشخیص موجود باشد. در این شرایط ماشین های تشخیص الگو با استفاده از یک رویه ی یادگیری یا تمرین دادن طراحی بهتری خواهند داشت. به صورت ابتدائی، توابع تصمیم موقت فرض می شوند و از طریق دنباله ای از مراحل تمرینی تکراری، این توابع تصمیم به سمت فرم های بهینه و راضی کننده پیش می روند. این مهم است به ذهن بسپاریم که تمرین و یادگیری فقط در طول فاز طراحی سیستم تشخیص الگو انجام می شوند. هنگامی که نتایج قابل قبول با مجموعه ی الگوهای تمرینی به دست آمد، سیستم برای وظیفه ی اجرائی واقعی خود بر روی نمونه های محیطی به کار گرفته می شود. کیفیت کارآئی تشخیص به طور گسترده ای به وسیله ی تشابه الگوهای تمرینی و داده های واقعی که سیستم در طول عملیات مواجه خواهد شد، تعیین می شود.

تشخیص الگوی نظارت شده و بدون نظارت[ویرایش]

در بسیاری موارد، الگوهای نماینده از هر کلاس موجود هستند. در این وضعیت ها، تکنیک های تشخیص الگوی نظارت شده ، کاربردی هستند. پایه های این رویکرد، مجموعه ای از الگوهای تمرینی شناخته شده برای دسته بندی و پیاده سازی یک رویه ی یادگیری مناسب هستند. در برخی کاربردها، فقط مجموعه ای از الگوهای تمرینی شناخته نشده برای دسته بندی ممکن است موجود باشند. در این موقعیت ها، تکنیک های تشخیص چهره ی بدون نظارت کاربرد دارند. همانطور که در بالا بیان شد، تشخیص الگوی نظارت یافته به وسیله ی این موضوع که دسته ی صحیح هر الگوی تمرینی مشخص است، معرفی می شوند. در مورد بدون نظارت، به هر حال، با مسئله ی یادگیری در کلاس های الگوی ارائه شده در داده ها، مواجهیم. این مسئله با نام " یادگیری بدون ناظر " نیز شناخته می شود.

کلیات یک سیستم تشخیص الگو[ویرایش]

در دیاگرام موجود کلیات یک سیستم تشخیص چهره تشخیص صحیح به میزان اطلاعات موجود در اندازه گیری ها و نحوه ی استفاده از این اطلاعات وابسته خواهد بود. در برخی کاربردها، اطلاعات زمینه برای بدست آوردن تشخیص دقیق الزامی است. برای نمونه، در تشخیص کارکترهای دست نویس خمیده و دسته بندی اثر انگشت ها، اطلاعات زمینه با اهمیت هستند.

الگوریتم ها[ویرایش]

الگوریتم انتخابی برای تشخیص الگو، به نوع خروجی، آموزش با ناظر یا بدون ناظر و پویا یا ایستا بودن طبیعت الگوریتم بستگی دارد. الگوریتم های ایستا به دو دسته generative وdiscriminative تقسیم می شوند.

الگوریتم های کلاس بندی(الگوریتم های با ناظر پیشگو)[ویرایش]

الگوریتم های خوشه ساری(الگوریتم های بدون ناظر پیشگو)[ویرایش]

الگوریتم های مبتنی بر رگرسیون[ویرایش]

با ناظر[ویرایش]

بدون ناظر[ویرایش]

  • Principal Components Analysis= PCA
  • LCA

کاربردها[ویرایش]

  • دسته بندی متون به گروه‌های مختلف (به عنوان نمونه، نامه‌های الکترونیکی شامل هرزنامه و بدون هرزنامه)
  • تشخیص خودکار کدهای پستی دست نویس روی پاکت‌های نامه
  • تشخیص خودکار چهره افراد[۱][۲]

منابع[ویرایش]

  1. Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0-471-05669-3
  2. R. Brunelli, Template Matching Techniques in Computer Vision: Theory and Practice, Wiley, ISBN 978-0-470-51706-2, 2009 ([1] TM book)

مطالعه بیشتر[ویرایش]

  • Fukunaga, Keinosuke (1990). Introduction to Statistical Pattern Recognition (2nd ed.). Boston: Academic Press. ISBN 0-12-269851-7. 
  • Bishop, Christopher (2006). Pattern Recognition and Machine Learning. Berlin: Springer. ISBN 0-387-31073-8. 
  • Koutroumbas, Konstantinos; Theodoridis, Sergios (2008). Pattern Recognition (4th ed.). Boston: Academic Press. ISBN 1-59749-272-8. 
  • Hornegger, Joachim; Paulus, Dietrich W. R. (1999). Applied Pattern Recognition: A Practical Introduction to Image and Speech Processing in C++ (2nd ed.). San Francisco: Morgan Kaufmann Publishers. ISBN 3-528-15558-2. 
  • Schuermann, Juergen (1996). Pattern Classification: A Unified View of Statistical and Neural Approaches. New York: Wiley. ISBN 0-471-13534-8. 
  • Godfried T. Toussaint, ed. (1988). Computational Morphology. Amsterdam: North-Holland Publishing Company. 
  • Kulikowski, Casimir A.; Weiss, Sholom M. (1991). Computer Systems That Learn: Classification and Prediction Methods from Statistics, Neural Nets, Machine Learning, and Expert Systems. Machine Learning. San Francisco: Morgan Kaufmann Publishers. ISBN 1-55860-065-5.