پرش به محتوا

شار بصری: تفاوت میان نسخه‌ها

از ویکی‌پدیا، دانشنامهٔ آزاد
محتوای حذف‌شده محتوای افزوده‌شده
Sina atashbari (بحث | مشارکت‌ها)
ایجاد شده توسط ترجمهٔ صفحهٔ «Optical flow»
(بدون تفاوت)

نسخهٔ ‏۱ فوریهٔ ۲۰۱۹، ساعت ۱۶:۵۳

جریان نوری توسط یک ناظر دوار (در این مورد یک l's) تجربه می شود. جهت و بزرگی جریان نور در هر مکان با جهت و طول هر فلش نشان داده شده است.

جریان(شار) نوری الگوی حرکت ظاهری اشیاء، سطوح و لبه ها در یک صحنه بصری ناشی از حرکت نسبی بین یک ناظر و یک صحنه است. [۱] [۲] شار نوری را میتوان به عنوان توزیع سرعت ظاهری حرکت الگوی روشنایی در یک تصویر نیز معرفی کرد. [۳] مفهوم بحث شار نوری توسط جيمز جونیور گيبسون، روانشناس آمریکایی در دهه 1940، برای توصيف حرکت های بصری ارائه شده به حیوانات در سراسر دنيا معرفی شد. [۴] تأکید گیبسون بر اهمیت جریان نور برای ادراک مقرون به صرفه است ، توانایی که برای تشخیص امکانات برای انجام عمل در محیط زیست است. پیروان گیبسون و رویکرد اکولوژیکی وی به روانشناسی بیشتر نقش محرک شار نوری را برای درک حرکت توسط ناظر در جهان نشان دادند؛ درک شکل، فاصله و حرکت اجسام در جهان؛ و کنترل حرکت. [۵]

بحث شار نوری همچنین توسط مهندسان روباتیک هم استفاده میشود،

نظیر مباحثی چون: تکنیک های مربوط به پردازش تصویر و کنترل هدایت که شامل تشخیص حرکت، تقسیم بندی شی، اطلاعات زمان به برخورد، تمرکز محاسبات گسترش، روشنایی، کد گذاری حرکت جبران شده و اندازه گیری اختلاف استریو. [۶] [۷]

تخمین

دنباله های مرتب شده از تصاویر اجازه تخمین حرکت به صورت پیوسته ازتصویر سرعت ها و یا به صورت گسسته از تصویر جابجایی ها را میدهند . [۷] فلیت و وایس یک اموزش مقدماتی برای شار نوری در حالت شیبدار را تهیه کرده اند. [۸] جان ل. بارون، دیوید ج. نائوت و استیون بیوکمین یک انالیز برای کارایی تعدادی از تکنیکهای شار نوری را فراهم کرده اند. این درستی و دقت سنجش را هرچه بیشتر تایید میکند. [۹]

متد(روش) های جریان نوری سعی بر محاسبه ی حرکت ، بین 2 فریم از تصاویر که در زمان های t و  در هر واکسل(کوکچترین مکعب مستطیل ها در فضا که میتوانند مختصات یک شیء را نشان دهند) را دارند . این متد ها دیفرانسیلی هستند زیرا بر مبنای تقریب بسط تیلور حول یک تصویر از سیگنال هستند . آن ]متد ها [ با استفاده از مختصات موقتی فضایی از مشتقات جزئی استفاده میکنند.

برای یک نمونه در حالت 2 بعدی (حالات 3 بعدی و بیشتر مشابه هستند) یک واکسل در مکان (x,y,t) با شدت I(x,y,t) به اندازه های  و  بین 2 فریم از تصاویر حرکت خواهد کرد و محدودیت پایداری نوری به صورت زیر میتواند داده شود :

شکست در تجزیه (خطای نحوی): {\displaystyle <mrow class="MJX-TeXAtom-ORD"><mstyle displaystyle="true" scriptlevel="0"><mi> <math>I(x,y,t) = I(x+\Delta x, y + \Delta y, t + \Delta t)} </mi><mo stretchy="false"> </mo><mi> </mi><mo> </mo><mi> </mi><mo> </mo><mi> </mi><mo stretchy="false"> </mo><mo> </mo><mi> </mi><mo stretchy="false"> </mo><mi> </mi><mo> </mo><mi mathvariant="normal"> </mi><mi> </mi><mo> </mo><mi> </mi><mo> </mo><mi mathvariant="normal"> </mi><mi> </mi><mo> </mo><mi> </mi><mo> </mo><mi mathvariant="normal"> </mi><mi> </mi><mo stretchy="false"> </mo></mstyle></mrow> </math>

(I(x,y,t) = I(x + ∆x , y + ∆y , t + ∆t

با فرض کوچک بودن تحرک ، محدودیت تصویر در I(x,y,t) را میتوان با بسط تیلور توسعه داد تا به عبارت زیر رسید:

شکست در تجزیه (خطای نحوی): {\displaystyle <mrow class="MJX-TeXAtom-ORD"><mstyle displaystyle="true" scriptlevel="0"><mi> <math>I(x+\Delta x,y+\Delta y,t+\Delta t) = I(x,y,t) + \frac{\partial I}{\partial x}\Delta x+\frac{\partial I}{\partial y}\Delta y+\frac{\partial I}{\partial t}\Delta t+} </mi><mo stretchy="false"> </mo><mi> </mi><mo> </mo><mi mathvariant="normal"> </mi><mi> </mi><mo> </mo><mi> </mi><mo> </mo><mi mathvariant="normal"> </mi><mi> </mi><mo> </mo><mi> </mi><mo> </mo><mi mathvariant="normal"> </mi><mi> </mi><mo stretchy="false"> </mo><mo> </mo><mi> </mi><mo stretchy="false"> </mo><mi> </mi><mo> </mo><mi> </mi><mo> </mo><mi> </mi><mo stretchy="false"> </mo><mo> </mo><mrow class="MJX-TeXAtom-ORD"><mfrac><mrow><mi mathvariant="normal"> </mi><mi> </mi></mrow><mrow><mi mathvariant="normal"> </mi><mi> </mi></mrow></mfrac></mrow><mi mathvariant="normal"> </mi><mi> </mi><mo> </mo><mrow class="MJX-TeXAtom-ORD"><mfrac><mrow><mi mathvariant="normal"> </mi><mi> </mi></mrow><mrow><mi mathvariant="normal"> </mi><mi> </mi></mrow></mfrac></mrow><mi mathvariant="normal"> </mi><mi> </mi><mo> </mo><mrow class="MJX-TeXAtom-ORD"><mfrac><mrow><mi mathvariant="normal"> </mi><mi> </mi></mrow><mrow><mi mathvariant="normal"> </mi><mi> </mi></mrow></mfrac></mrow><mi mathvariant="normal"> </mi><mi> </mi><mo> </mo></mstyle></mrow> </math>

از این معادلات بدست می آید که:

یا

که در نتیجه

که V, V در آن، اجزای سرعت x و y یا جریان نوری (I(x,y,t هستند و a, a, a مشتقات تصویر در (x,y,t) در جهات متناظر هستند. I, I, I را می توان برای مشتقات بالا نوشت

پس:

شکست در تجزیه (خطای نحوی): {\displaystyle <mrow class="MJX-TeXAtom-ORD"><mstyle displaystyle="true" scriptlevel="0"><msub><mi> <math>I_xV_x+I_yV_y=-I_t} </mi><mrow class="MJX-TeXAtom-ORD"><mi> </mi></mrow></msub><msub><mi> </mi><mrow class="MJX-TeXAtom-ORD"><mi> </mi></mrow></msub><mo> </mo><msub><mi> </mi><mrow class="MJX-TeXAtom-ORD"><mi> </mi></mrow></msub><msub><mi> </mi><mrow class="MJX-TeXAtom-ORD"><mi> </mi></mrow></msub><mo> </mo><mo> </mo><msub><mi> </mi><mrow class="MJX-TeXAtom-ORD"><mi> </mi></mrow></msub></mstyle></mrow> </math>

یا

شکست در تجزیه (خطای نحوی): {\displaystyle <mrow class="MJX-TeXAtom-ORD"><mstyle displaystyle="true" scriptlevel="0"><mi mathvariant="normal"> <math>\nabla I^T\cdot\vec{V} = -I_t} </mi><msup><mi> </mi><mrow class="MJX-TeXAtom-ORD"><mi> </mi></mrow></msup><mo> </mo><mrow class="MJX-TeXAtom-ORD"><mrow class="MJX-TeXAtom-ORD"><mover><mi> </mi><mo stretchy="false"> </mo></mover></mrow></mrow><mo> </mo><mo> </mo><msub><mi> </mi><mrow class="MJX-TeXAtom-ORD"><mi> </mi></mrow></msub></mstyle></mrow> </math>

این یک معادله با 2 مجهول است و بدین صورت نمیتواند حل شود . این به  مشکل دیافراگمی الگویرتم های جریان نوری معروف است. برای یافتن جریان نوری یک معادله ی دیگر نیز نیاز است . با دادن چند محدودیت جدید ، تمامی متد های جریان نوری شرایط بیشتری را برای تخمین جریان واقعی معرفی میکنند.

روش های تشخیص:

  • همبستگی فاز-معکوس صورت هنجاری طیف قدرت متقابل.
  • روش های مبتنی بر اساس انسداد-به حداقل رساندن جمع مربعات اختلاف ها یا جمع قدرمطلقشان و یا به حداکثر رساندن همبستگی هنجار متقابل .
  • روش های تفاضلی تخمین شار نوری براساس قسمت به دست آمده ای از تصویر و میدان شار طلب شده و بخش های به مراتب بالاتر نظیر:
  • روش لوکاس کاناد-با توجه به تکه های تصویر و یک مدل وابسته برای میدان شار.
  • روش هرن شانک-بهینه سازی کارآمد براساس مانده های بدست آمده از محدودیت پایداری روشنایی و یک عبارت مشخص برای هنجار سازی که نشان دهنده ی همواری مورد انتظار در میدان شار است.
  • روش باکستون-برپایه ی نمونه ای از حرکت لبه ها در توالی تصویر.
  • روش بلک جپسون-شار نوری درشت از طریق همبستگی.
  • روش های عمومی تغییر پذیر-تعدادی از اصلاحات و توسعه های روش هرن شانک با استفاده از دیگر شرایط هموار.
  • روش های بهینه سازی گسسته-فضای جستجو کوانتیزه می شود و سپس تطبیق تصویر از طریق تخصیص برچسب در هر پیکسل صورت می گیرد. بطوریکه تغییر شکل مربوطه فاصله ی بین منبع و تصویر هدف را به حداقل می رساند. راه حل های بهینه سازی شده اکثراٌ و غالباٌ از طریق الگوریتم های نظری حداکثر شار معکوس، برنامه نویسی خطی و یا روش های انتشار باور، بهینه می شود.
  • بسیاری از این موارد گفته شده علاوه بر الگوریتم های موجود در حال حاضر بر روی مجموعه ی داده های معیار میدلبوری ارزیابی می شوند.

استفاده ها

برآورد حرکت و فشرده سازی ویدئو از جنبه های اصلی تحقیق در زمینه شار نوری است. در حالی که میدان شار نوری به صورت محسوس شبیه به یک میدان حرکت متراکم است که از تکنیک های برآورد حرکت استخراج میشود ، شارنوری فقط مطالعه تعیین میدان شار نوری نیست بلکه استفاده از ان در براورد ماهیت سه بعدی و ساختار صحنه است, همچنین حرکت سه بعدی اشیا و ناظر نسبت به صحنه.اکثرا انها از اصل ژاکوبیین استفاده میکنند.

شار نوری توسط محققان رباتیک در بسیاری از زمینه ها نظیر: تشخیص و ردیابی شیء، استخراج عناصر تصویری غالب، تشخیص حرکت، هدایت ربات ها و حساسیت بصری استفاده شده است . [۶] اطلاعات شار نوری به عنوان عاملی مفید برای کنترل وسایل نقلیه هوایی میکرو شناخته شده است. [۱۰]

استفاده از شار نوری شامل مشکلی است که نه تنها نتیجه گیری حرکت ناظر و اجسام در صحنه بلکه همچنین تشخیص ساختار اشیا و محیط را نیز در بر میگرید. با توجه به اینکه اگاهی از حرکت و تولید نقشه های ذهنی از ساختار محیط اطرافاجزا مهم و حیاتی در دید حیوان ها و انسان هاست,تبدیل این توانایی به قابلیت کامپیوتری نیز در دید ماشین ها به همان میزان مهم است . [۱۱]

بردار جریان نوری یک شیء متحرک در توالی ویدیو.

یک کلیپ پنج فریمی از یک توپ که از پایین و سمت چپ میدان دید به سمت بالا و راست حرکت میکند در نظر بگیرید. تکنیک های برآورد حرکت می توانند تعیین کنند که در یک صحنه دو بعدی توپ به سمت بالا و ر است حرکت میکند و بردارهایی که این حرکت را توصیف میکنند میتوانند از توالی فریم ها استخراج شوند. برای اهداف فشرده سازی ویدیو (به عنوان مثال، MPEG )، دنباله درحال حاضر همان طور که باید می بود توصیف شده است. با این حال، در زمینه دید ماشین ها، سوال این است که آیا توپ به سمت راست حرکت می کند یا این که ناظر در حال حرکت به سمت چپ است ، این اطلاعات برای ماشین ناشناخته و در عین حال حیاتی است. حتی اگر یک پس زمینه و الگوی در پنج فریم موجود باشد،ایا می توانیم با اطمینان بیان کنیم که توپ از سمت راست حرکت می کند، چراکه امکان دارد الگو فاصله ی بینهایت با ناظر داشته باشد.

حسگر شار نوری

سنسور شار نوری حسگر دیدی است که قادر است شار نوری یا حرکت بعدی را اندازه گیری کند و خروجی یک اندازه گیری براساس شار نوری است.تنظیمات متفاوت برای سنسور شار نوری وجود دارد.یکی از این پیکربندی ها یک تراشه حسگر تصویر است که با اتصال به یک پردازنده برای اجرای الگوریتم شار نوری برنامه ریزی شده است.یکی دیگر از پیکربندی ها از یک تراشه بصری استفاده می کند که یک مدار مجتمع است که در برگیرنده هر دو سنسور تصویر و پردازنده در همان دیسک است، که اجازه ی یک اجرای جامع و کلی را می دهد.یک نمونه از موارد استفاده این سنسور به صورت عمومی در موس های نوری است.در برخی از موارد، مدار پردازش ممکن است با استفاده از مدار های آنالوگ یا سیگنال مختلط به کار گرفته شود تا امکان محاسبات سریع شار نوری را با استفاده از کمترین مقدار مصرف کنونی بدهد.

یکی از زمینه های تحقیقات معاصر، استفاده از روش های مهندسی نورومورفیک برای اجرا کردن مدارهایی است که به شار نوری پاسخ می دهند، این سبک مدارها ممکن است از الگوریتم های بیولوژیکی الهام بگیرندکه به طرز مشابه ای به شار نوری پاسخ می دهند.

حسگرهای شار نوری به صورت گسترده ای در موس های نوری کامپیوتری مورد استفاده قرار می گیرند، این حسگرها به عنوان جزء اصلی سنجش برای اندازه گیری حرکت موس در سطح هستند.

سنسورهای شار نوری همچنین در برنامه های روباتیکی استفاده می شوند.در درجه ی اول جایی که نیاز به اندازه گیری بصری یا حرکت نسبی بین ربات و دیگر اشیاء در مجاورت ربات وجود دارد. استفاده از سنسورهای شار نوری در وسایل نقلیه بدون سرنشین (هواپیماهای بدون سرنشین)، برای پایداری و جلوگیری از برخورد با موانع، بخشی از تحقیقات

همچنین ببینید

  • آرایه محیطی محیطی
  • موس نوری
  • تصویربرداری محدوده
  • واحد پردازش دید

منابع

  1. Andrew Burton; John Radford (1978). Thinking in Perspective: Critical Essays in the Study of Thought Processes. Routledge. ISBN 0-416-85840-6. {{cite book}}: Unknown parameter |lastauthoramp= ignored (|name-list-style= suggested) (help)
  2. David H. Warren; Edward R. Strelow (1985). Electronic Spatial Sensing for the Blind: Contributions from Perception. Springer. ISBN 90-247-2689-1. {{cite book}}: Unknown parameter |lastauthoramp= ignored (|name-list-style= suggested) (help)
  3. Gibson, J.J. (1950). The Perception of the Visual World. Houghton Mifflin.
  4. Royden, C. S.; Moore, K. D. (2012). "Use of speed cues in the detection of moving objects by moving observers". Vision Research. 59: 17–24. doi:10.1016/j.visres.2012.02.006.
  5. ۶٫۰ ۶٫۱ Kelson R. T. Aires; Andre M. Santana; Adelardo A. D. Medeiros (2008). Optical Flow Using Color Information (PDF). ACM New York, NY, USA. ISBN 978-1-59593-753-7.
  6. ۷٫۰ ۷٫۱ S. S. Beauchemin; J. L. Barron (1995). The computation of optical flow. ACM New York, USA.
  7. David J. Fleet; Yair Weiss (2006). "Optical Flow Estimation". In Paragios (ed.). Handbook of Mathematical Models in Computer Vision (PDF). Springer. ISBN 0-387-26371-3. {{cite book}}: Unknown parameter |lastauthoramp= ignored (|name-list-style= suggested) (help)
  8. John L. Barron; David J. Fleet; Steven Beauchemin (1994). "Performance of optical flow techniques" (PDF). International Journal of Computer Vision. Springer. 12: 43–77. doi:10.1007/bf01420984. {{cite journal}}: Unknown parameter |last-author-amp= ignored (|name-list-style= suggested) (help)
  9. Barrows GL، Chahl JS، و Srinivasan MV، سنجش بصری الهام گرفته از محیط زیست و کنترل پرواز، مجله هواپیما Journal. 107، ص 159-268، 2003.
  10. Christopher M. Brown (1987). Advances in Computer Vision. Lawrence Erlbaum Associates. ISBN 0-89859-648-3.

لینک های خارجی