مدل کانتور فعال

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو
مدل مارها - مدل غیرقابل تغییر فعال

مدل کانتور فعال، که مدل مارها نیز نامیده می‌شود، یک چارچوب در بینایی رایانه ای است که توسط مایکل کاس، اندرو ویتکین و دمتری ترزوپولوس معرفی شده، و برای ترسیم خطوط خارجی یک شیء، از یک تصویر دو بعدی احتمالاً پر نویز تعریف شده‌است.[۱] مدل مارها در دیدگاه رایانه‌ای محبوب است و این مدل به‌طور گسترده در برنامه‌های کاربردی مانند ردیابی شی، تشخیص شکل، تقسیم‌بندی، آشکارسازی لبه و تطبیق استریو مورد استفاده قرار می‌گیرد.

مدل مار یک انرژی کمینه کننده و اسپلاین قابل اصلاح است که تحت تأثیر محدودیت‌ها و نیروهای تصویر است که آن را به سمت کانتورها و نیروهای داخلی متصل می‌کند که مقاومت در برابر تغییر شکل را دارند. مدل مارها ممکن است به عنوان یک مورد خاص از روش کلی تطبیق یک مدل ناپایدار به یک تصویر با استفاده از به حداقل رساندن انرژی درک شوند.[۱] در دو بعد، مدل شکل فعال، یک نسخه گسسته این رویکرد را نشان می‌دهد، با استفاده از مدل توزیع نقطه برای محدود کردن محدوده شکل به یک دامنه صریح از یک مجموعه آموزشی یاد می‌شود.

مارها کل مشکل پیدا کردن خطوط در تصاویر را حل نمی‌کنند، زیرا این روش نیاز به دانش قبلی شکل کانتورهای طرحی شده دارد. در عوض، آنها به مکانیزم‌های دیگر مانند تعامل با یک کاربر، تعامل با برخی از فرآیندهای درک تصویری سطح بالاتر یا اطلاعاتی از داده‌های تصویر مجاور در زمان یا فضا بستگی دارد.

انگیزه و هدف[ویرایش]

در دیدگاه رایانه، مدلهای کانتور، مرزهای شکل در یک تصویر را توصیف می‌کنند. مدل مارها به‌طور خاص طراحی شده‌اند تا مشکلات را حل کنند که در آن شکل تقریبی مرز شناخته شده‌است. با داشتن یک مدل تغییر شکل‌پذیر، مارها می‌توانند به تفاوت و نویز در تطبیق استریو و ردیابی حرکت سازگار شوند. علاوه بر این، این روش می‌تواند خطوط غیرواقعی در تصویر را با نادیده گرفتن اطلاعات مرزی گم شده پیدا کند.

در مقایسه با تکنیک‌های استخراج ویژگی کلاسیک، مدل مارها مزایای متعددی دارند:

  • آنها مستقل و سازگارانه برای حداقل حالت جستجو می‌کنند.
  • نیروهای تصویری خارجی به شیوه ای بصری بر روی مار عمل می‌کنند.
  • ترکیب کردن Gaussian smoothing در تابع انرژی تصویر، حساسیت مقیاسی را نشان می‌دهد.
  • آنها می‌توانند برای ردیابی اجزای در حال حرکت مورد استفاده قرار گیرند.

اشکالات کلیدی روش سنتی مارهای عبارتند از:

  • آنها به حالتهای مینیمم محلی حساس هستند، که با تکنیک‌های انجماد شبیه‌سازی شده می‌توانند خنثی شوند.
  • ویژگی‌های جزئی اغلب در طول کاهش انرژی در سراسر کانتور نادیده گرفته می‌شوند.
  • دقت آنها بستگی به تدبیر همگرا دارد.[۲]

فرمول انرژی[ویرایش]

یک مار قابل ارتجاع ساده با مجموعه ای از نقطه تعریف می‌شود که ، ترم انرژی درونی انعطاف‌پذیر ، و انرژی بر اساس لبه خارجی نامیده می‌شود. هدف از اصطلاح انرژی درونی، کنترل تغییرات ساخته شده در مار است و هدف از اصطلاح انرژی خارجی، کنترل اتصالات کانتور بر روی تصویر است. انرژی خارجی معمولاً ترکیبی از نیروهای مربوط به خود تصویر و نیروهای محدود کننده معرفی شده توسط کاربر است.

عملکرد انرژی مارها مجموع انرژی خارجی و انرژی داخلی آن است یا به عبارتی:

انرژی درونی[ویرایش]

انرژی داخلی مار از تداوم کانتور تشکیل شده‌است و صافی کانتور .

[۳]

می‌توان به صورت زیر گسترش داد:

که و وزن تعریف شده توسط کاربر هستند که حساسیت عملکرد انرژی داخلی به مقدار کشش در مار و مقدار انحنای مار را محاسبه می‌کند و به این ترتیب تعداد محدودیت‌های شکل مار را کنترل می‌کند. در عمل، وزن بزرگ برای مدت زمان تداوم تغییرات در فاصله بین نقاط در کانتور را جبران می‌کند. وزن بزرگ برای مدت زمان نرم شدگی، نوسانات در کانتور را جبران می‌کند و خطوط را به عنوان یک صفحه نازک عمل می‌کند.

انرژی تصویر[ویرایش]

انرژی در تصویر برخی از ویژگی‌های تصویر است. این یکی از رایج‌ترین اصلاحات در روش‌های مشتق شده‌است. ویژگی‌ها در تصاویر و تصاویر خود را می‌توان در بسیاری از روش‌های مختلف پردازش شده‌است. برای یک تصویر ، خطوط، لبه‌ها و انتهای موجود در تصویر، فرمول بندی کلی انرژی به دلیل تصویر است:

,

جایی که، , , وزن این ویژگی‌های برجسته هستند. وزن‌های بالاتر نشان می‌دهد که ویژگی برجسته سهم بیشتری نسبت به نیروی تصویر داشته‌است.

خط عملکردی[ویرایش]

تابع خط است که شدت تصویر است که می‌تواند به عنوان نشان داده شود

نشانه ای از تعیین خواهد کرد که آیا خط به خطوط تاریک یا خطوط نور جذب خواهد شد. برخی از کاهش صوت یا نویز ممکن است بر روی تصویر استفاده شود، و سپس عملکرد تابع خط به نظر می‌رسد

لبه کاربردی[ویرایش]

لبه عملکردی بر اساس شیب تصویر است. یک اجرای این است

یک مار که دور از کانتور مورد نظر قرار دارد ممکن است به اشتباه به حداقل محلی نزدیک شود. به منظور اجتناب از این کمینه‌های محلی، می‌توان از ادامه فضای مقیاس استفاده کرد. این با استفاده از یک فیلتر تاری در تصویر به دست می‌آید و به میزان محاسبه می‌شود که محاسبات پیشرفت می‌کند تا تناسب مار را اصلاح کند. عملکرد انرژی با استفاده از مقیاس فضا ادامه دارد

جایی که گاوسی با انحراف معیار است. حداقل این تابع در عبور از صفر قرار دارد که لبه‌ها را بر اساس نظر مارر هیلدرت تعریف می‌کنند.

خاتمه عملیات[ویرایش]

انحنای سطوح سطح در یک تصویر تقریباً صاف می‌تواند برای تشخیص گوشه‌ها و انتهای یک تصویر استفاده شود. با استفاده از این روش، تصویری که توسط

با زاویه شیب

,

بردارهای واحد در امتداد جهت گرادیان

,

و بردارهای واحد عمود بر جهت گرادیان

عملکرد خاتمه انرژی به صورت زیر نشان داده می‌شود:

انرژی محدود[ویرایش]

بعضی از سیستم‌ها، از جمله پیاده‌سازی مارها اصلی، برای تعامل کاربر برای هدایت مارها، نه تنها در موقعیت اولیه، بلکه در شرایط انرژی آنها، امکان‌پذیر است. چنین محدودیتی انرژی می‌تواند به‌طور تعاملی هدایت مار به سمت یا دور از ویژگی‌های خاص مورد استفاده قرار گیرد.

بهینه‌سازی از طریق رسیدن به گرادیان[ویرایش]

با توجه به یک حدس اولیه برای یک مار، عملکرد انرژی مار به‌طور تکراری کمینه می‌شود. به حداقل رساندن گرادیان کاهشی یکی از ساده‌ترین بهینه‌سازی‌ها می‌باشد که می‌تواند برای به حداقل رساندن انرژی مار استفاده شود.[۴] هر تکرار یک گام در شیب منفی نقطه با اندازه گام کنترل شده‌است برای پیدا کردن مینیمم‌های محلی این به حداقل رساندن شیب نزولی می‌تواند به عنوان مثال پیاده‌سازی شود

جایی که نیروی مار است که توسط منفی گرادیان میدان انرژی تعریف می‌شود.

با فرض وزن و ثابت با توجه به ، این روش تکرار می‌تواند به ساده‌تر شدن باشد

تقریب گسسته[ویرایش]

در عمل، تصاویر دارای وضوح محدود هستند و تنها می‌توانند بر روی گام‌های زمانی محدود قرار گیرند. به این ترتیب تقریبهای گسسته باید برای اجرای عملی مارها ساخته شود. عملکرد انرژی مارها می‌تواند با استفاده از نقاط گسسته مارها تقریباً محاسبه شود.

به همین ترتیب، نیروهای مار را می‌توان تقریبی به عنوان

تقریب گرادیان را می‌توان با استفاده از هر روش تقریبی محدود با توجه به s, مانند اختلاف محدود.

بی‌ثباتی عددی به دلیل زمان گسسته[ویرایش]

معرفی زمان گسسته به الگوریتم می‌تواند به روز رسانی‌هایی ارائه کند که مارها از حداقل‌ها جذب شده‌است؛ این بیشتر می‌تواند منجر به نوسانات در اطراف حداقل شود یا منجر به کمینه‌های مختلف یافت شود.

این را می‌توان از طریق تنظیم گام زمانی که اندازه گام هرگز بیشتر از یک پیکسل به علت نیروهای تصویر است، اجتناب کنید. با این حال، در مناطق کم انرژی، انرژی‌های داخلی بر روی به روز رسانی تسلط دارند.

به‌طور متناوب، نیروهای تصویر می‌توانند برای هر مرحله عادی شوند به طوری که تصویر فقط مارها را به صورت یک پیکسل به روز می‌کند. این را می‌توان به عنوان فرموله کرد:

جایی که نزدیک به مقدار اندازه پیکسل است. این مسئله از غلبه بر انرژی‌های داخلی که از تنظیم گام زمان جلوگیری می‌کند.[۵]

بی‌ثباتی عددی به دلیل فضای گسسته[ویرایش]

انرژی در یک تصویر مداوم ممکن است عبور صفر داشته باشد که به عنوان یک پیکسل در تصویر وجود ندارد. در این مورد، یک نقطه در مار بین دو پیکسل که همسایه آن عبور صفر است، نوسان می‌کند. این نوسان را می‌توان با استفاده از درون یابی بین پیکسل به جای نزدیکترین همسایه اجتناب کرد.[۵]

پیاده‌سازی[ویرایش]

pseudocode زیر روش مار را به صورت کلی اجرا می‌کند:

function v = snakes (I, v)
  % INPUT: N by M image I, a contour v of n control points
  % OUTPUT: converged contour v of n control points

  E_image = generateImageEnergy (I);

  while not converged
    F_cont = weight.alpha * contourDerivative(v, 2);
    F_curv = weight.beta * contourDerivative(v, 4);
    F_image = interp2 (E_image, v(:,2), v(:,1));
    F_image_norm = weight.k * F_image ./ norm (F_image);
    F_con = inputForces();

    F_internal = F_cont + weight.external * F_curv;
    F_external = weight.external * (F_image + F_con);

    v = updateSnake(v, F_internal, F_external);

    checkConvergence ();
  end

end

جایی که generateImageEnergy (I) را می‌توان به عنوان نوشته کرد

function E_image = generateImageEnergy (I)
  [C, Cx, Cy, Cxx, Cxy, Cyy] = generateGradients (I);

  E_line = I;
  E_edge = -(Cx.^2 + Cy.^2)^0.5;
  E_term = (Cyy.*Cx.^2 - 2*Cxy.*Cx.*Cy + Cxx.*Cy.^2)./((1 + Cx.^2 + Cy.^2).^(1.5));

  E_image = weight.line * E_line + weight.edge * E_edge + weight.term * E_term;
end

برخی از انواع مارها[ویرایش]

روش پیش فرض مارها دارای محدودیت‌های مختلف و موارد گوشه ای است که همگرایی عملکرد ضعیفی دارد. چندین جایگزین وجود دارد که مسائل مربوط به روش پیش فرض را در بر می‌گیرد، هرچند با مشارکت خودشان. چند نفر در اینجا لیست شده‌اند.

مدل مار GVF[ویرایش]

مدل مار مارپیچ گرادیان (GVF)[۶] دو مسئله را با مارها مطرح می‌کند:

  • عملکرد ضعیف همگرا برای مرزهای مقعر
  • عملکرد ضعیف همگرا زمانی که مار از مقدار کمتری شروع می‌شود

در دو بعد، فیلد بردار GVF، کارکرد انرژی را به حداقل می‌رساند

جایی که یک اصطلاح هموار کنترل شده‌است. این را می‌توان با حل معادلات اویل حل کرد

این را می‌توان از طریق تکرار به سمت یک مقدار ثابت حل کرد.

این نتیجه نیروی پیش فرض خارجی را جایگزین می‌کند.

مشکل اصلی با استفاده از GVF نرم کردن ترم است که موجب گرد کردن لبه‌های کنتور می‌شود. کاهش ارزش گرد کردن را کاهش می‌دهد اما مقدار صاف کردن را تضعیف می‌کند.

مدل بالون[ویرایش]

مدل بالون[۵] این مشکلات را با مدل کنتور پیش فرض فعال شرح می‌دهد:

  • مار به لبه‌های دور جذب نشده‌است.
  • مار در داخل کوچک می‌شود اگر هیچ نیروی تصویری قابل توجه بر روی آن تأثیری نداشته باشد
  • یک مار که بزرگتر از کانیم مینیموم است در نهایت آن را کاهش می‌دهد، اما یک مار کوچکتر از کانون مینیمم، حداقل‌ها را پیدا نخواهد کرد و در عوض ادامه می‌یابد.

مدل بالون یک دوره تورم را به نیروهایی که بر روی مار اعمال می‌کنند معرفی می‌کند

که بردار واحد معمولی منحنی در و بزرگی نیرو است. باید بزرگی یکسانی به عنوان ضریب نرمالیزه تصویر داشته باشد و در ارزش از کمتر باشد برای مجاز کردن نیروها در لبه‌های تصویر برای برانگیختن نیروی تورم. سه مسئله از استفاده از مدل بالون به وجود آمده‌است:

  • به جای کوچک شدن، مار به مینیمم گسترش می‌یابد و حداقل حدفاصل‌های کوچک‌تر از آن را پیدا نمی‌کند.
  • نیروی بیرونی باعث می‌شود که حدفاصل کمی بزرگتر از حداقل باشد.
  • نیروی تورم می‌تواند نیروها را از لبه‌های ضعیف ببندد، و مسئله را با مارها نادیده می‌گیرد و ویژگی‌های ضعیف را در یک تصویر نادیده می‌گیرد.

مدل مارهای نفوذی[ویرایش]

مدل مار نفوذی[۷] حساسیت مارها به نویز، کلفت و انسداد را مورد توجه قرار می‌دهد. این یک اصلاح ویژگی‌های مامفورد-شاه و محدودیت کارتونی آن را به کار می‌گیرد و شامل دانش شکل است. عملکرد تصویر پیش فرض تصویر جایگزین شده‌است با

که E_i براساس یک کارکرد مامفورد-شاه اصلاح شده‌است

که یک مدل صاف و از تصویر با دامنه . مرزها تعریف شده‌اند

که عملکرد پایه‌های B-اسپلین درجه دوم و نقاط کنترل اسپلین هستند. محدودیت کارتونی اصلاح شده به عنوان و تنظیمات معتبر از . تابع بر اساس آموزش از تصاویر باینری از خطوط مختلف است و توسط پارامتر . برای یک توزیع گاوسی از بردارهای نقطه کنترل z با میانگین بردار نقطه کنترل و ماتریس کواریانس سیگما، انرژی درجه دوم که با احتمال گاوسی مطابقت دارد

استحکام این روش به قدرت داده‌های آموزشی و نیز تنظیم عملکرد مامورد-شاه تغییر یافته بستگی دارد. مارهای مختلف نیاز به مجموعه داده‌های مختلف آموزش و تنظیمات دارند.

خطوط هندسی فعال[ویرایش]

کانتور فعال هندسی، یا کانونی فعال ژئودزیک (GAC)[۸] یا کانونی‌های فعال کانونی،[۹] ایده‌هایی را از تکامل یقین ایدل استفاده می‌کند. کانتورها بسته به تشخیص اشیاء در تصویر تقسیم و ادغام می‌شوند. این مدلها عمدتاً از مجموعه‌های سطح الهام گرفته شده‌است و به‌طور گسترده در محاسبات تصویر پزشکی استفاده شده‌است. به عنوان مثال، معادله تکاملی منحنی زاویه گرادیان GAC است[۸]

که یک عمل متوقف است، c یک ضریب لاگرانژ است، منحنی و واحد نرمال داخلی است. این شکل خاص از معادله تکامل منحنی تنها به سرعت در جهت نرمال وابسته است؛ بنابراین، با قرار دادن تابع تنظیم سطح، می‌توان آن را به صورت معادل در یک فرم یورلین بازنویسی کرد به آن به شرح زیر است

این اصلاح ساده و در عین حال قدرتمند سطح را قادر می‌سازد خطوط فعال برای مرتب‌سازی تغییرات توپولوژی در طی تکامل منحنی نزول شیب. این پیشرفت فوق‌العاده ای را در زمینه‌های مرتبط الهام داده‌است و با استفاده از روش‌های عددی برای حل دوباره تعریف سطح، اکنون به عنوان روش تعیین سطح شناخته می‌شود. وانگ و چان استدلال می‌کنند که تمام معادلات تکاملی منحنی باید مستقیماً توسط آن حل شود.[۱۰]

تحولات اخیر در کانتورهای فعال در زمینه مدل سازی خواص منطقه ای، ترکیب قالب‌های انعطاف‌پذیر و تقسیم‌بندی کاملاً اتوماتیک و غیره.

مدل‌های آماری که ترکیبی از ویژگی‌های محلی و جهانی هستند، توسط لانکتون و آلن تاننبام فرموله شده‌اند.[۱۱]

ارتباط با کاهش گراف‌ها[ویرایش]

برش گراف یا حداکثر جریان / دقیقه برش یک روش عمومی برای به حداقل رساندن یک شکل خاص انرژی به نام میدان مغناطیسی مارکوف (MRF) است. روش تقسیم گراف نیز به تقسیم‌بندی تصویر اعمال شده‌است و گاهی اوقات از روش تعیین سطح در زمانی که مدل MRF استفاده می‌کند یا می‌تواند توسط MRF تقریب یابد، بهتر عمل می‌کند.

منابع[ویرایش]

  1. ۱٫۰ ۱٫۱ Kass, M.; Witkin, A.; Terzopoulos, D. (1988). "Snakes: Active contour models" (PDF). International Journal of Computer Vision. 1 (4): 321. CiteSeerX 10.1.1.124.5318. doi:10.1007/BF00133570.
  2. Snakes: an active model, Ramani Pichumani, http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/RAMANI1/node31.html
  3. Dr. George Bebis, University of Nevada, http://www.cse.unr.edu/~bebis/CS791E/Notes/DeformableContours.pdf
  4. Image Understanding, Bryan S. Morse, Brigham Young University,1998-2000 http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/MORSE/iu.pdf
  5. ۵٫۰ ۵٫۱ ۵٫۲ Laurent D. Cohen, On active contour models and balloons, CVGIP: Image Understanding, Volume 53, Issue 2, March 1991, Pages 211-218, ISSN 1049-9660, doi:10.1016/1049-9660(91)90028-N
  6. C. Xu and J.L. Prince, "Gradient Vector Flow: A New External Force for Snakes," Proc. IEEE Conf. on Comp. Vis. Patt. Recog. (CVPR), Los Alamitos: Comp. Soc. Press, pp. 66–71, June 1997, http://iacl.ece.jhu.edu/pubs/p087c.pdf
  7. Cremers, D.; Schnorr, C.; Weickert, J. (2001). Diffusion-snakes: combining statistical shape knowledge and image information in a variational framework. Proceedings. IEEE Workshop on. 50. pp. 137–144. CiteSeerX 10.1.1.28.3639. doi:10.1109/VLSM.2001.938892. ISBN 978-0-7695-1278-5.
  8. ۸٫۰ ۸٫۱ Geodesic Active Contours, V. Caselles, R. Kimmel, G. Sapiro http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.21.2196
  9. Conformal curvature flows: From phase transitions to active vision, Satyanad Kichenassamy, Arun Kumar, Peter Olver, Allen Tannenbaum and Anthony Yezzi http://www.springerlink.com/content/u457157212872201/
  10. Wang, Junyan; Chan, Kap Luk (2014-07-08). "Active Contour with a Tangential Component". Journal of Mathematical Imaging and Vision. 51 (2): 229–247. arXiv:1204.6458. doi:10.1007/s10851-014-0519-y. ISSN 0924-9907.
  11. Lankton, S. ; Tannenbaum, A. , "Localizing Region-Based Active Contours," Image Processing, IEEE Transactions on, vol.17, no.11, pp.2029,2039, Nov. 2008 doi: 10.1109/TIP.2008.2004611 http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4636741&tag=1

پیوند به بیرون[ویرایش]

کد نمونه[ویرایش]