تقسیم بندی اشتراکی اشیاء

دربینایی رایانه ای، تقسیم بندی مشترک اشیا یک مورد خاص از بخش بندی تصویر است که به صورت تقسیم مشترک اشیاء با معانی مشابه در چندین تصویر یا فریم ویدیو تعریف می‌شود.^[۱]^[۲]

چالش‌ها[ویرایش]

استخراج ماسک‌های تقسیم‌بندی یک هدف/شی از مجموعه‌ای شلوغ از تصاویر یا فریم‌های ویدئویی، که شامل کشف شی همراه با تقسیم‌بندی است، اغلب چالش‌برانگیز است. یک مجموعه شلوغ به این معنی است که شی/هدف به صورت پراکنده در مجموعه ای از تصاویر وجود دارد یا شی/هدف به‌طور متناوب در طول ویدیوی مورد نظر ناپدید می‌شود. روش‌های اولیه^[۳]^[۴] معمولاً شامل بازنمایی‌های سطح متوسط مانند طرح‌های پیشنهادی اشیا هستند.

روش‌های مبتنی بر شبکه‌های مارکوف پویا[ویرایش]

اخیراً یک روش کشف شیء مشترک و تقسیم‌بندی مشترک مبتنی بر شبکه‌های مارکوف پویا پیشنهاد شده است^[۵] که ادعا می‌کند پیشرفت‌های قابل‌توجهی در استحکام در برابر فریم‌های ویدیویی نامربوط/نویزدار دارد.

برخلاف تلاش‌های قبلی که به راحتی حضور ثابت اشیاء هدف را در طول ویدیوی ورودی فرض می‌کردند، این الگوریتم دوگانه پویا مبتنی بر شبکه مارکوف به‌طور همزمان هر دو وظیفه تشخیص و تقسیم‌بندی را با دو شبکه مارکوف مربوطه انجام می‌دهد که به‌طور مشترک از طریق انتشار باور به روز شده‌اند.

به‌طور خاص، شبکه مارکوف که مسئولیت بخش‌بندی را بر عهده دارد با سوپرپیکسل‌ها مقداردهی اولیه می‌شود و اطلاعاتی را برای همتای مارکوف خود که مسئول وظیفه تشخیص شی است، ارائه می‌کند. برعکس، شبکه مارکوف که مسئول تشخیص است، گراف پیشنهادی شی را با ورودی‌هایی از جمله لوله‌های تقسیم بندی مکانی-زمانی می‌سازد.

منابع[ویرایش]

↑ Vicente, Sara; Rother, Carsten; Kolmogorov, Vladimir (2011). "Object cosegmentation". CVPR 2011. IEEE. pp. 2217–2224. doi:10.1109/cvpr.2011.5995530. ISBN 978-1-4577-0394-2.
↑ Chen, Ding-Jie; Chen, Hwann-Tzong; Chang, Long-Wen (2012). "Video object cosegmentation". Proceedings of the 20th ACM international conference on Multimedia - MM '12. New York, New York, USA: ACM Press. p. 805. doi:10.1145/2393347.2396317. ISBN 978-1-4503-1089-5.
↑ Lee, Yong Jae; Kim, Jaechul; Grauman, Kristen (2011). "Key-segments for video object segmentation". 2011 International Conference on Computer Vision. IEEE. pp. 1995–2002. doi:10.1109/iccv.2011.6126471. ISBN 978-1-4577-1102-2.
↑ Ma, Tianyang; Latecki, Longin Jan (2012). Maximum weight cliques with mutex constraints for video object segmentation. IEEE CVPR 2012. pp. 670–677. doi:10.1109/CVPR.2012.6247735. ISBN 978-1-4673-1228-8.
↑ Liu, Ziyi; Wang, Le; Hua, Gang; Zhang, Qilin; Niu, Zhenxing; Wu, Ying; Zheng, Nanning (2018). "Joint Video Object Discovery and Segmentation by Coupled Dynamic Markov Networks" (PDF). IEEE Transactions on Image Processing. 27 (12): 5840–5853. Bibcode:2018ITIP...27.5840L. doi:10.1109/tip.2018.2859622. ISSN 1057-7149. PMID 30059300. S2CID 51867241.

[1] Vicente, Sara; Rother, Carsten; Kolmogorov, Vladimir (2011). "Object cosegmentation". CVPR 2011. IEEE. pp. 2217–2224. doi:10.1109/cvpr.2011.5995530. ISBN 978-1-4577-0394-2.

[2] Chen, Ding-Jie; Chen, Hwann-Tzong; Chang, Long-Wen (2012). "Video object cosegmentation". Proceedings of the 20th ACM international conference on Multimedia - MM '12. New York, New York, USA: ACM Press. p. 805. doi:10.1145/2393347.2396317. ISBN 978-1-4503-1089-5.

[3] Lee, Yong Jae; Kim, Jaechul; Grauman, Kristen (2011). "Key-segments for video object segmentation". 2011 International Conference on Computer Vision. IEEE. pp. 1995–2002. doi:10.1109/iccv.2011.6126471. ISBN 978-1-4577-1102-2.

[4] Ma, Tianyang; Latecki, Longin Jan (2012). Maximum weight cliques with mutex constraints for video object segmentation. IEEE CVPR 2012. pp. 670–677. doi:10.1109/CVPR.2012.6247735. ISBN 978-1-4673-1228-8.

[5] Liu, Ziyi; Wang, Le; Hua, Gang; Zhang, Qilin; Niu, Zhenxing; Wu, Ying; Zheng, Nanning (2018). "Joint Video Object Discovery and Segmentation by Coupled Dynamic Markov Networks" (PDF). IEEE Transactions on Image Processing. 27 (12): 5840–5853. Bibcode:2018ITIP...27.5840L. doi:10.1109/tip.2018.2859622. ISSN 1057-7149. PMID 30059300. S2CID 51867241.

[۱]

[۲]

[۳]

[۴]

[۵]