استخراج ویژگی

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

استخراج ویژگی (به انگلیسی: Feature extraction) فرایندی است که در آن با انجام عملیاتی بر روی داده‌ها، ویژگی‌های بارز و تعیین‌کنندهٔ آن مشخص می‌شود.

روش‌ها و اهداف[ویرایش]

هدف استخراج ویژگی این است که داده‌های خام به شکل قابل استفاده‌تری برای پردازش‌های آماری بعدی درآیند.

روش‌های مختلف استخراج ویژگی بنا به فلسفهٔ پشت سرشان ممکن است یک یا چند کار زیر را انجام دهند:

  1. حذف نوفه داده‌ها
  2. جداسازی اجزای مستقل داده‌ها
  3. فروکاهی ابعاد برای تولید بازنمایی مختصرتر
  4. افزایش بعد برای تولید بازنمایی جدایی‌پذیری‌تر

انجام استخراج ویژگی فرایند بسیار متداول‌ای در انواع مختلف پردازش داده‌ها چون پردازش تصویر، پردازش صوت و غیره است.

استخراج ویژگی در پردازش تصویر[ویرایش]

برای اینکه از روی الگوهای یک تصویر هویت و یا خالق آن تصویر مشخص شود باید یک سری مشخصات عام و یا خاص از دل تصویر بیرون کشیده شود که به این کار استخراج ویژگی ()گفته می‌شود.به عنوان مثال در تشخیص امضاء به وسیله پردازش تصویر یک سری ویژگی ها(مانند شیب خط ها) از تصویر اسکن شدهٔ امضاء بیرون کشیده می‌شود، که به وسیله آن می‌توان صاحب امضاء راتشخیص داد

سطح پایین[ویرایش]

تشخیص آستانه یا thresholding یکی از اولین مراحل تعداد زیادی از برنامه های پردازش تصویر است در این مرحله با پیدا کردن یک استانه؛ زمینه عکس از اجسام جدا می گردد.

لبه در واقع مرز میان یک شکل(Object)و پس زمینه(Background)می باشد که برای پردازش تصاویر باید لبه‌ها مشخص شوند تا محدوده تصویر تعیین گردد.

خمش[ویرایش]

  • جهت لبه، شدت متغیر، خودبستگی

حرکت تصویر[ویرایش]

بر اساس شکل[ویرایش]

آستانه‌گذاری[ویرایش]

تطبیق الگو[ویرایش]

تبدیل هاف[ویرایش]

  • خط‌ها
  • دایره‌ها و بیضی‌ها
  • اشکال دلخواه (تبدیل هاگ تعمیم‌یافته)

روش‌های منعطف[ویرایش]

استخراج ویژگی در پردازش گفتار[ویرایش]

در تجزیه و تحليل سيگنال گفتار ويژگي‌هاي مختلفي استفاده مي‌شود که انتخاب ويژگي مورد نظر بسته به کاربرد صورت مي‌گيرد، چرا که شرايط مناسب کاربرد هر يک با ديگري متفاوت است. براي مثال، ممکن است برخي ویژگی‌ها در محيط‌هاي نويزي جواب بهتري دهند و يا اينکه حجم محاسبات کمتري را طلب کنند. اين ويژگي‌ها گاه در کل سيگنال گفتار و گاه در يک پنجره از آن محاسبه مي‌شوند، ولي در تحليل سيگنال گفتار به‌طور معمول ويژگي‌هاي سيگنال پنجره‌بندي شده تحليل مي‌شود. اين ويژگي‌ها گاه يک عددند، نظير انرژي يا ميانگين پنجرة سيگنال گفتار و گاه يک بردارند. براي مثال، خود اندازة سيگنال گفتار در حوزة زمان را مي‌توان به‌صورت برداري يک‌بعدي با طول تعداد نقاط پنجرة گفتار درنظرگرفت. ازاين‌رو، گاه از اين ويژگي‌ها با نام ضرايب ويژگي يا بردارهاي ويژگي نيز ياد مي‌شود. پس از انجام عمليات استخراج ويژگي، تحليل را بر يك بردار مثلاً 12بعدي انجام مي‌دهيم که براي تحليل مورد نظر کاراتر است. برخي از معروف‌ترين اين ويژگي‌ها عبارت‌اند از بلندي، نسبت سيگنال به نويز، تعداد عبور از صفر، ضرايب پيشگويي خطي يا LPC، ضرايب کپستروم و مشتقات آن[3].

منابع[ویرایش]

  • Gonzalez, R. C., and Woods, R. E. (2002), Digital Image Processing (2nd ed.), Prentice-Hall, Inc., ISBN 0-201-18075-8

[۳] کتاب مبانی پردازش سیگنال گفتار، دکتر سعید آیت، انتشارات دانشگاه پیام نور، ۱۳۸۷.

منابع مرتبط[ویرایش]