ردیابی ویدیویی

از ویکی‌پدیا، دانشنامهٔ آزاد

ردیابی ویدیویی فرایند تعیین مکان یک شی متحرک یا اشیاء متحرک با استفاده از دوربین در طول زمان است. کاربردهای متنوعی دارد که برخی از آنها عبارتند از: تعامل کامپیوترـ انسان، امنیت و نظارت، ارتباطات ویدیویی و فشرده‌سازی، واقعیت افزوده، کنترل ترافیک، تصویربرداری پزشکی و ویرایش ویدئو. ردیابی ویدیویی به دلیل حجم داده‌های موجود در ویدیو می‌تواند فرایند زمان‌بری باشد. علاوه بر پیچیدگی، نیاز احتمالی به استفاده از تکنیک‌های تشخیص اشیا برای ردیابی در نوع خود یک مشکل چالش‌برانگیز است.

اهداف[ویرایش]

هدف از ردیابی ویدیویی، مرتبط کردن اشیاء هدف در فریم‌های ویدیویی متوالی است. این ارتباط می‌تواند به شکل خاصی دشوار باشد هنگامی که اشیا نسبت به نرخ فریم سریع حرکت می‌کنند. موقعیت دیگری که پیچیدگی مشکل را افزایش می‌دهد هنگامی است که شی ردیابی شده در هر لحظه جهت خود را تغییر می‌دهد. برای این موقعیت‌ها، سیستم‌های ردیابی ویدیویی معمولاً از یک مدل حرکتی استفاده می‌کنند که نشان می‌دهد چگونه تصویر هدف برای حرکات مختلف محتمل، ممکن است تغییر کند.

نمونه‌هایی از مدل‌های حرکتی ساده عبارتند از:

هنگام ردیابی اشیاء مسطح، مدل حرکت یک تبدیل دوبعدی (تبدیل پیوندی یا هموگرافی) از یک تصویر از جسم است.

هنگامی که هدف یک شی سه بعدی سخت باشد، مدل حرکتی، جنبه آن را بر اساس سه بعدی و جهت‌گیری آن مشخص می‌کند.

برای فشرده سازی ویدئو، فریم‌های کلیدی به بلوک‌های بزرگ تقسیم می‌شوند. این مدل حرکتی اختلالی در یک فریم کلیدی است که هر بلوک بزرگ توسط یک بردار حرکتی که توسط پارامترهای حرکتی داده شده‌است، ترجمه می‌شود.

تصویر اجسام تغییرپذیر می‌تواند با یک مش پوشانده شود، حرکت این اشیاء با موقعیت گره‌های مش تعیین می‌شود.

الگوریتم‌ها[ویرایش]

برای ردیابی ویدئویی، الگوریتمی فریم‌های ویدئویی متوالی را تحلیل و بررسی می‌کند و حرکت تارگت‌ها بین این فریم‌ها را خروجی می‌دهد. الگوریتم‌های گوناگونی وجود دارد که هر کدام نقاط ضعف و قوتی دارند. در نظر گرفتن کاربرد مورد انتظار هنگام انتخاب الگوریتم مورد استفاده مهم است. سیستم ردیابی دیداری دارای دو جزء اصلی است: نمایش هدف و بومی سازی، و همچنین فیلتر کردن و ارتباط داده‌ها.

نمایش هدف و بومی سازی عمدتاً یک فرایند پایین به بالا است. این روش‌ها ابزارهای مختلفی برای شناسایی جسم متحرک ارائه می‌دهند. مکان‌یابی و ردیابی موفقیت‌آمیز شی مورد نظر وابسته به الگوریتم است. به عنوان مثال، استفاده از ردیابی حبابی برای شناسایی حرکت انسان مفید است، زیرا مشخصات فرد به‌طور پویا تغییر می‌کند. معمولاً پیچیدگی محاسباتی این الگوریتم‌ها کم است. در زیر برخی از الگوریتم‌های رایج نمایش هدف و محلی‌سازی هدف آمده‌است:

ردیابی مبتنی بر هسته (ردیابی میانگین تغییر): یک روش محلی سازی تکراری بر اساس بیشینه سازی معیار شباهت.

ردیابی خطوط: شناسایی مرز جسم (به عنوان مثال خطوط فعال یا الگوریتم تراکم). روش‌های ردیابی خطوط به‌طور مکرر خطوط اولیه را که از فریم قبلی به موقعیت جدید آن در قاب فعلی مقداردهی شده‌است، تغییر می‌دهند. این رویکرد برای ردیابی خطوط مستقیم با به کمینه سازی انرژی خطوط با استفاده از نزول گرادیان، خطوط را تغییر می‌دهد.

فیلترینگ و ارتباط داده‌ها عمدتاً یک فرایند بالا به پایین است که شامل ترکیب اطلاعات قبلی در مورد صحنه یا شی، پرداختن به دینامیک شی و ارزیابی فرضیه‌های مختلف است. این روش‌ها امکان ردیابی اجسام پیچیده را به همراه تعامل اشیاء پیچیده‌تر مانند ردیابی اجسام در حال حرکت در پشت موانع را فراهم می‌کنند. علاوه بر این، اگر ردیاب ویدیویی (همچنین ردیاب تلویزیون یا ردیاب هدف نیز نامیده می‌شود) روی پایه سفت نصب نشود، پیچیدگی افزایش خواهد یافت. اما در یک کشتی متحرک که معمولاً از یک سیستم اندازه‌گیری لَختی برای پیش‌ثبات‌سازی ردیاب ویدیویی استفاده می‌شود تا دینامیک و پهنای باند مورد نیاز سیستم دوربین کاهش یابد. پیچیدگی محاسباتی این الگوریتم‌ها معمولاً خیلی بیشتر است. برخی الگوریتم‌های رایج فیلترینگ در زیر آمده‌است:

فیلتر کالمان: فیلتر بیزی بازگشتی بهینه برای توابع خطی تحت نویز گاوسی. الگوریتمی است که از یک سری اندازه‌گیری‌های مشاهده شده در طول زمان، حاوی نویزو سایر نادرستی‌ها استفاده می‌کند و تخمین‌هایی از متغیرهای ناشناخته را تولید می‌کند که تمایل دارند دقیق‌تر از اندازه‌گیری‌های مبتنی بر یک اندازه‌گیری منفرد باشند.

فیلتر ذرات: برای نمونه‌برداری از توزیع فضای حالت فرآیندهای غیرخطی و غیر گاوسی مفید است.

منابع[ویرایش]