شبکه عصبی کپسول: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده

درخط

نسخهٔ ‏۴ دسامبر ۲۰۱۸، ساعت ۰۹:۰۲

یک شبکه عصبی کپسول (CapsNet) یک سیستم یادگیری ماشین است که یک نوع شبکه عصبی مصنوعی (ANN) است که می تواند مورد استفاده قرار گیرد برای مدل کردن بهتر روابط سلسله مراتبی است. این رویکرد تلاشی برای نزدیک‌تر کردن تقلید ساختار زیستی عصبی است.^[۱]

ایده این است که برای اضافه کردن ساختار‌هایی به نام کپسول به شبکه های عصبی کانولوشن (CNN) و به استفاده مجدد خروجی از چند تا از این کپسول به فرم با ثبات‌تر (با توجه به آشفتگی) قابل ارائه برای کپسول‌های مرتبه بالاتر.^[۲] خروجی یک وکتور متشکل از احتمال مشاهده و ژست (موقعیت، اندازه، جهت) که برای مشاهده. این وکتور شبیه به آنچه که برای مثال در هنگام انجام طبقه بندی با محلی سازی در CNNها انجام می‌شود است.

از جمله دیگر مزایای شبکه‌های کپسول می‌توان به "مشکل پیکاسو" در تشخیص تصویر: تصاویر دارای تمامی بخش‌های درست هستند ولی در رابطه فضایی درستی قرار ندارند (برای مثال: در یک چهره، موقعیت بینی و یک چشم جایشان عوض شده باشد). برای تشخیص تصویر، شبکه‌های کپسول از این حقیقت استخراج شده استفاده می‌کنند که در زمان تغییر نقطه دید، تغییرات تاثیر غیرخطی در سطح پیکسل و تاثیر خطی در سطح اجزا/اشیا دارند.^[۳] این را می توان در مقایسه با رندر یک شی از چند بخش مقایسه کرد.^[۴]

تاریخچه

در سال 2000 جفری هینتون و همکارانش. یک سیستم تصویربرداری که در ترکیب بخش‌بندی و تشخیص به یک استنتاج با استفاده از فرایند تجزیه درختان می‌پرداخت. به اصطلاح شبکه های اعتبار توصیف شده توزیع مشترکی بر روی متغيرهای پنهان و تجزیه درختان ممکن بود. که آن سیستم مفید بودن خود را در پایگاه داده ارقام دست‌نوشته MNIST ثابت نمود.

یادداشت

منابع

↑ Sabour, Sara; Frosst, Nicholas; Hinton, Geoffrey E. (2017-10-26). "Dynamic Routing Between Capsules". arXiv:1710.09829 [cs].
↑ Hinton, Geoffrey E.; Krizhevsky, Alex; Wang, Sida D. (2011). Transforming Auto-Encoders (به انگلیسی). Berlin, Heidelberg: Springer Berlin Heidelberg. pp. 44–51. doi:10.1007/978-3-642-21735-7_6.
↑ Sargur Srihari. "Capsule Nets" (PDF) (به انگلیسی).
↑ Hinton, Geoffrey E; Ghahramani, Zoubin; Teh, Yee Whye (2000). Solla, S. A.; Leen, T. K.; Müller, K. (eds.). Advances in Neural Information Processing Systems 12 (PDF). MIT Press. pp. 463–469.

خطای یادکرد: برچسپ <ref> که با نام «:1» درون <references> تعریف شده، در متن قبل از آن استفاده نشده است.

[1] Sabour, Sara; Frosst, Nicholas; Hinton, Geoffrey E. (2017-10-26). "Dynamic Routing Between Capsules". arXiv:1710.09829 [cs].

[2] Hinton, Geoffrey E.; Krizhevsky, Alex; Wang, Sida D. (2011). Transforming Auto-Encoders (به انگلیسی). Berlin, Heidelberg: Springer Berlin Heidelberg. pp. 44–51. doi:10.1007/978-3-642-21735-7_6.

[3] Sargur Srihari. "Capsule Nets" (PDF) (به انگلیسی).

[:0-4] Hinton, Geoffrey E; Ghahramani, Zoubin; Teh, Yee Whye (2000). Solla, S. A.; Leen, T. K.; Müller, K. (eds.). Advances in Neural Information Processing Systems 12 (PDF). MIT Press. pp. 463–469.

[۱]

[۲]

[۳]

[۴]

@@ خط ۱: / خط ۱: @@
-یک''' شبکه عصبی کپسول''' ('''CapsNet''') یک سیستم یادگیری ماشین است که یک نوع [[شبکه عصبی مصنوعی]] (ANN) است که می تواند مورد استفاده قرار گیرد برای  مدل کردن بهتر روابط سلسله مراتبی است. این رویکرد تلاشی برای نزدیک‌تر کردن تقلید ساختار زیستی عصبی است.
+یک''' شبکه عصبی کپسول''' ('''CapsNet''') یک سیستم یادگیری ماشین است که یک نوع [[شبکه عصبی مصنوعی]] (ANN) است که می تواند مورد استفاده قرار گیرد برای  مدل کردن بهتر روابط سلسله مراتبی است. این رویکرد تلاشی برای نزدیک‌تر کردن تقلید ساختار زیستی عصبی است.<ref>{{Cite journal|last=Sabour|first=Sara|last2=Frosst|first2=Nicholas|last3=Hinton|first3=Geoffrey E.|date=2017-10-26|title=Dynamic Routing Between Capsules|url=http://arxiv.org/abs/1710.09829|journal=arXiv:1710.09829 [cs]}}</ref>
-ایده این است که برای اضافه کردن ساختار‌هایی به نام کپسول به [[شبکه عصبی پیچشی|شبکه های عصبی کانولوشن]] (CNN) و به استفاده مجدد خروجی از چند تا از این کپسول به فرم با ثبات‌تر (با توجه به آشفتگی) قابل ارائه برای کپسول‌های مرتبه بالاتر. خروجی یک وکتور متشکل از احتمال مشاهده و  ژست (موقعیت، اندازه، جهت) که برای مشاهده. این وکتور شبیه به آنچه که برای مثال در هنگام انجام ''طبقه بندی با محلی سازی'' در CNNها انجام می‌شود است.
+ایده این است که برای اضافه کردن ساختار‌هایی به نام کپسول به [[شبکه عصبی پیچشی|شبکه های عصبی کانولوشن]] (CNN) و به استفاده مجدد خروجی از چند تا از این کپسول به فرم با ثبات‌تر (با توجه به آشفتگی) قابل ارائه برای کپسول‌های مرتبه بالاتر.<ref>{{یادکرد کتاب|نشانی=https://link.springer.com/chapter/10.1007%2F978-3-642-21735-7_6|عنوان=Transforming Auto-Encoders|نام خانوادگی=Hinton|نام=Geoffrey E.|نام خانوادگی۲=Krizhevsky|نام۲=Alex|نام خانوادگی۳=Wang|نام۳=Sida D.|تاریخ=2011|ناشر=Springer Berlin Heidelberg|شابک=9783642217340|مکان=Berlin, Heidelberg|صفحات=44–51|زبان=en|doi=10.1007/978-3-642-21735-7_6}}</ref> خروجی یک وکتور متشکل از احتمال مشاهده و  ژست (موقعیت، اندازه، جهت) که برای مشاهده. این وکتور شبیه به آنچه که برای مثال در هنگام انجام ''طبقه بندی با محلی سازی'' در CNNها انجام می‌شود است.
-از جمله دیگر مزایای شبکه‌های کپسول می‌توان به "مشکل پیکاسو" در تشخیص تصویر: تصاویر دارای تمامی بخش‌های درست هستند ولی در رابطه فضایی درستی قرار ندارند (برای مثال: در یک چهره، موقعیت بینی و یک چشم جایشان عوض شده باشد). برای تشخیص تصویر، شبکه‌های کپسول از این حقیقت استخراج شده استفاده می‌کنند که در زمان تغییر نقطه دید، تغییرات تاثیر غیرخطی در سطح پیکسل و تاثیر خطی در سطح اجزا/اشیا دارند. این را می توان در مقایسه با رندر یک شی از چند بخش مقایسه کرد.
+از جمله دیگر مزایای شبکه‌های کپسول می‌توان به "مشکل پیکاسو" در تشخیص تصویر: تصاویر دارای تمامی بخش‌های درست هستند ولی در رابطه فضایی درستی قرار ندارند (برای مثال: در یک چهره، موقعیت بینی و یک چشم جایشان عوض شده باشد). برای تشخیص تصویر، شبکه‌های کپسول از این حقیقت استخراج شده استفاده می‌کنند که در زمان تغییر نقطه دید، تغییرات تاثیر غیرخطی در سطح پیکسل و تاثیر خطی در سطح اجزا/اشیا دارند.<ref>{{یادکرد وب|نویسنده=Sargur Srihari|کد زبان=en|نشانی=https://cedar.buffalo.edu/~srihari/CSE676/9.12%20CapsuleNets.pdf|عنوان=Capsule Nets}}</ref> این را می توان در مقایسه با رندر یک شی از چند بخش مقایسه کرد.<ref name=":0">{{Cite book|url=http://papers.nips.cc/paper/1710-learning-to-parse-images.pdf|title=Advances in Neural Information Processing Systems 12|last=Hinton|first=Geoffrey E|last2=Ghahramani|first2=Zoubin|last3=Teh|first3=Yee Whye|date=2000|publisher=MIT Press|editor-last=Solla|editor-first=S. A.|pages=463–469|editor-last2=Leen|editor-first2=T. K.|editor-last3=Müller|editor-first3=K.}}</ref>
+<br />
 == تاریخچه ==
-در سال 2000 [[جفری اورست هینتون|جفری هینتون]] و همکارانش. یک سیستم تصویربرداری که در ترکیب [[بخش‌بندی تصویر|بخش‌بندی]] و [[بینایی رایانه‌ای|تشخیص]] به یک استنتاج با استفاده از فرایند [[نمودار درختی تجزیه|تجزیه درختان]] می‌پرداخت. به اصطلاح شبکه های اعتبار توصیف شده توزیع مشترکی بر روی متغيرهای پنهان و تجزیه درختان ممکن بود. که آن سیستم مفید بودن خود را در پایگاه داده ارقام دست‌نوشته MNIST ثابت نمود.
+در سال 2000 [[جفری اورست هینتون|جفری هینتون]] و همکارانش. یک سیستم تصویربرداری که در ترکیب [[بخش‌بندی تصویر|بخش‌بندی]] و [[بینایی رایانه‌ای|تشخیص]] به یک استنتاج با استفاده از فرایند [[نمودار درختی تجزیه|تجزیه درختان]] می‌پرداخت. به اصطلاح شبکه های اعتبار توصیف شده توزیع مشترکی بر روی متغيرهای پنهان و تجزیه درختان ممکن بود. که آن سیستم مفید بودن خود را در پایگاه داده ارقام دست‌نوشته [http://yann.lecun.com/exdb/mnist/ MNIST] ثابت نمود.