تبدیل ویژگی مقیاس‌نابسته

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

تبدیل مستقل از مقیاس ویژگی (SIFT) یک الگوریتم در بینایی ماشین است که برای استخراج ویژگی‌های مشخص از تصاویر، برای استفاده در الگوریتم‌های کارهایی چون تطبیق نماهای مختلف یک جسم یا صحنه(برای نمونه در دید دوچشمی) و شناسایی اجسام به کار می‌رود. ویژگی‌های بدست آمده نسبت به مقیاس تصویر و چرخش ناوردا و نسبت به تغییر دیدگاه و تغییرات نورپردازی تا اندازه‌ای ناوردایند. نام تبدیل مقیاس‌نابسته ویژگی از آن سو که الگوریتم داده‌های تصویر را به مختصات مقیاس‌نابسته‌ای نسبت به ویژگی‌های محلی تبدیل می‌کند بر آن نهاده شد.

الگوریتم توسط دیوید لوو در دانشگاه بریتیش کلمبیا ساخته شد، که امتیاز ثبت اختراع آن در ایالات متحده را نیز دارد.

نخست، تصویر اصلی به طور پیش‌رونده با فیلترهای گاوسی با سیگما در بازه ۱ تا ۲ محو می‌شود که حاصلش یک سری تصاویر محو شده گاوسی است.(فیلتر کردن آبشاری). سپس، این تصویرها از همسایگان بلافصل خود(از دید سیگما) کم می‌شوند تا یک سری جدید از تصاویر پدید آیند(از تفاضل گاوسی).

گام‌های اصلی در محاسبه ویژگی‌های تصویر عبارت‌اند از:

  1. آشکارسازی اکسترمم‌های فضای مقیاس - هر پیکسل در تصاویر با هشت همسایه‌اش و نه پیکسل(پیکسل متناظر و هشت همسایه‌اش) از هر یک از تصاویر دیگر سری مقایسه می‌شود.
  2. محلی‌سازی کلیدنقطه‌ها - کلیدنقطه‌ها از اکسترمم‌های فضای مقیاس گزیده می‌شوند.
  3. گرایش گماری - برای هر کلیدنقطه در یک پنجره ۱۶x۱۶، نمودار فراوانی گرایش گرادیان‌ها به کمک درونیابی دوسویه محاسبه می‌شوند.
  4. توصیفگر کلیدنقطه - نمایش در یک بردار ۱۲۸ عنصری.

برای بکارگیری کلیدنقطگان SIFT در تطبیق و بازشناسی جسم، لوو از یک الگوریتم نزدیک‌ترین همسایه، به همراه یک تبدیل هاگ سود جست(آنگونه که در لوو،۲۰۰۴ آمده است).

SIFT بخشی بنیادی از الگوریتم‌های ViPR و vSLAM ساخته شده توسط شرکت اوُلوشن رباتیکز است که یک الگوریتم هدفیابی/محلی‌سازی بر اساس SIFT نیز برای ایبوی سونی پیاده‌سازی کرده‌است که به کمک آن ایستگاه پر کردن باتری خود را پیدا می‌کند.

تصور می‌شود نمایش‌های ویژگی پیدا شده با SIFT به نمایش‌هایی که توسط نورون‌های پوسته گیجگاهی تحتانی استفاده می‌شوند شبیه‌اند، ناحیه‌ای از مغز که برای بازشناسی جسم در بینایی نخستینگان استفاده می‌شود.

جستارهای درونی[ویرایش]

پیوند به بیرون[ویرایش]

مراجع[ویرایش]

  • Lowe، D. G.، "distinctive image features from scale-invariant keypoints"، International Journal of Computer Vision، ۲۰۰۴