شبکه عصبی کپسول: تفاوت میان نسخهها
ایجاد شده توسط ترجمهٔ صفحهٔ «Capsule neural network» |
جز ←منابع |
||
خط ۱: | خط ۱: | ||
یک''' شبکه عصبی کپسول''' ('''CapsNet''') یک سیستم یادگیری ماشین است که یک نوع [[شبکه عصبی مصنوعی]] (ANN) است که می تواند مورد استفاده قرار گیرد برای مدل کردن بهتر روابط سلسله مراتبی است. این رویکرد تلاشی برای نزدیکتر کردن تقلید ساختار زیستی عصبی است. |
یک''' شبکه عصبی کپسول''' ('''CapsNet''') یک سیستم یادگیری ماشین است که یک نوع [[شبکه عصبی مصنوعی]] (ANN) است که می تواند مورد استفاده قرار گیرد برای مدل کردن بهتر روابط سلسله مراتبی است. این رویکرد تلاشی برای نزدیکتر کردن تقلید ساختار زیستی عصبی است.<ref>{{Cite journal|last=Sabour|first=Sara|last2=Frosst|first2=Nicholas|last3=Hinton|first3=Geoffrey E.|date=2017-10-26|title=Dynamic Routing Between Capsules|url=http://arxiv.org/abs/1710.09829|journal=arXiv:1710.09829 [cs]}}</ref> |
||
ایده این است که برای اضافه کردن ساختارهایی به نام کپسول به [[شبکه عصبی پیچشی|شبکه های عصبی کانولوشن]] (CNN) و به استفاده مجدد خروجی از چند تا از این کپسول به فرم با ثباتتر (با توجه به آشفتگی) قابل ارائه برای کپسولهای مرتبه بالاتر. خروجی یک وکتور متشکل از احتمال مشاهده و ژست (موقعیت، اندازه، جهت) که برای مشاهده. این وکتور شبیه به آنچه که برای مثال در هنگام انجام ''طبقه بندی با محلی سازی'' در CNNها انجام میشود است. |
ایده این است که برای اضافه کردن ساختارهایی به نام کپسول به [[شبکه عصبی پیچشی|شبکه های عصبی کانولوشن]] (CNN) و به استفاده مجدد خروجی از چند تا از این کپسول به فرم با ثباتتر (با توجه به آشفتگی) قابل ارائه برای کپسولهای مرتبه بالاتر.<ref>{{یادکرد کتاب|نشانی=https://link.springer.com/chapter/10.1007%2F978-3-642-21735-7_6|عنوان=Transforming Auto-Encoders|نام خانوادگی=Hinton|نام=Geoffrey E.|نام خانوادگی۲=Krizhevsky|نام۲=Alex|نام خانوادگی۳=Wang|نام۳=Sida D.|تاریخ=2011|ناشر=Springer Berlin Heidelberg|شابک=9783642217340|مکان=Berlin, Heidelberg|صفحات=44–51|زبان=en|doi=10.1007/978-3-642-21735-7_6}}</ref> خروجی یک وکتور متشکل از احتمال مشاهده و ژست (موقعیت، اندازه، جهت) که برای مشاهده. این وکتور شبیه به آنچه که برای مثال در هنگام انجام ''طبقه بندی با محلی سازی'' در CNNها انجام میشود است. |
||
از جمله دیگر مزایای شبکههای کپسول میتوان به "مشکل پیکاسو" در تشخیص تصویر: تصاویر دارای تمامی بخشهای درست هستند ولی در رابطه فضایی درستی قرار ندارند (برای مثال: در یک چهره، موقعیت بینی و یک چشم جایشان عوض شده باشد). برای تشخیص تصویر، شبکههای کپسول از این حقیقت استخراج شده استفاده میکنند که در زمان تغییر نقطه دید، تغییرات تاثیر غیرخطی در سطح پیکسل و تاثیر خطی در سطح اجزا/اشیا دارند. این را می توان در مقایسه با رندر یک شی از چند بخش مقایسه کرد. |
از جمله دیگر مزایای شبکههای کپسول میتوان به "مشکل پیکاسو" در تشخیص تصویر: تصاویر دارای تمامی بخشهای درست هستند ولی در رابطه فضایی درستی قرار ندارند (برای مثال: در یک چهره، موقعیت بینی و یک چشم جایشان عوض شده باشد). برای تشخیص تصویر، شبکههای کپسول از این حقیقت استخراج شده استفاده میکنند که در زمان تغییر نقطه دید، تغییرات تاثیر غیرخطی در سطح پیکسل و تاثیر خطی در سطح اجزا/اشیا دارند.<ref>{{یادکرد وب|نویسنده=Sargur Srihari|کد زبان=en|نشانی=https://cedar.buffalo.edu/~srihari/CSE676/9.12%20CapsuleNets.pdf|عنوان=Capsule Nets}}</ref> این را می توان در مقایسه با رندر یک شی از چند بخش مقایسه کرد.<ref name=":0">{{Cite book|url=http://papers.nips.cc/paper/1710-learning-to-parse-images.pdf|title=Advances in Neural Information Processing Systems 12|last=Hinton|first=Geoffrey E|last2=Ghahramani|first2=Zoubin|last3=Teh|first3=Yee Whye|date=2000|publisher=MIT Press|editor-last=Solla|editor-first=S. A.|pages=463–469|editor-last2=Leen|editor-first2=T. K.|editor-last3=Müller|editor-first3=K.}}</ref> |
||
<br /> |
|||
== تاریخچه == |
== تاریخچه == |
||
در سال 2000 [[جفری اورست هینتون|جفری هینتون]] و همکارانش. یک سیستم تصویربرداری که در ترکیب [[بخشبندی تصویر|بخشبندی]] و [[بینایی رایانهای|تشخیص]] به یک استنتاج با استفاده از فرایند [[نمودار درختی تجزیه|تجزیه درختان]] میپرداخت. به اصطلاح شبکه های اعتبار توصیف شده توزیع مشترکی بر روی متغيرهای پنهان و تجزیه درختان ممکن بود. که آن سیستم مفید بودن خود را در پایگاه داده ارقام دستنوشته MNIST ثابت نمود. |
در سال 2000 [[جفری اورست هینتون|جفری هینتون]] و همکارانش. یک سیستم تصویربرداری که در ترکیب [[بخشبندی تصویر|بخشبندی]] و [[بینایی رایانهای|تشخیص]] به یک استنتاج با استفاده از فرایند [[نمودار درختی تجزیه|تجزیه درختان]] میپرداخت. به اصطلاح شبکه های اعتبار توصیف شده توزیع مشترکی بر روی متغيرهای پنهان و تجزیه درختان ممکن بود. که آن سیستم مفید بودن خود را در پایگاه داده ارقام دستنوشته [http://yann.lecun.com/exdb/mnist/ MNIST] ثابت نمود. |
||
نسخهٔ ۴ دسامبر ۲۰۱۸، ساعت ۰۹:۰۲
یک شبکه عصبی کپسول (CapsNet) یک سیستم یادگیری ماشین است که یک نوع شبکه عصبی مصنوعی (ANN) است که می تواند مورد استفاده قرار گیرد برای مدل کردن بهتر روابط سلسله مراتبی است. این رویکرد تلاشی برای نزدیکتر کردن تقلید ساختار زیستی عصبی است.[۱]
ایده این است که برای اضافه کردن ساختارهایی به نام کپسول به شبکه های عصبی کانولوشن (CNN) و به استفاده مجدد خروجی از چند تا از این کپسول به فرم با ثباتتر (با توجه به آشفتگی) قابل ارائه برای کپسولهای مرتبه بالاتر.[۲] خروجی یک وکتور متشکل از احتمال مشاهده و ژست (موقعیت، اندازه، جهت) که برای مشاهده. این وکتور شبیه به آنچه که برای مثال در هنگام انجام طبقه بندی با محلی سازی در CNNها انجام میشود است.
از جمله دیگر مزایای شبکههای کپسول میتوان به "مشکل پیکاسو" در تشخیص تصویر: تصاویر دارای تمامی بخشهای درست هستند ولی در رابطه فضایی درستی قرار ندارند (برای مثال: در یک چهره، موقعیت بینی و یک چشم جایشان عوض شده باشد). برای تشخیص تصویر، شبکههای کپسول از این حقیقت استخراج شده استفاده میکنند که در زمان تغییر نقطه دید، تغییرات تاثیر غیرخطی در سطح پیکسل و تاثیر خطی در سطح اجزا/اشیا دارند.[۳] این را می توان در مقایسه با رندر یک شی از چند بخش مقایسه کرد.[۴]
تاریخچه
در سال 2000 جفری هینتون و همکارانش. یک سیستم تصویربرداری که در ترکیب بخشبندی و تشخیص به یک استنتاج با استفاده از فرایند تجزیه درختان میپرداخت. به اصطلاح شبکه های اعتبار توصیف شده توزیع مشترکی بر روی متغيرهای پنهان و تجزیه درختان ممکن بود. که آن سیستم مفید بودن خود را در پایگاه داده ارقام دستنوشته MNIST ثابت نمود.
یادداشت
منابع
- ↑ Sabour, Sara; Frosst, Nicholas; Hinton, Geoffrey E. (2017-10-26). "Dynamic Routing Between Capsules". arXiv:1710.09829 [cs].
- ↑ Hinton, Geoffrey E.; Krizhevsky, Alex; Wang, Sida D. (2011). Transforming Auto-Encoders (به انگلیسی). Berlin, Heidelberg: Springer Berlin Heidelberg. pp. 44–51. doi:10.1007/978-3-642-21735-7_6.
- ↑ Sargur Srihari. "Capsule Nets" (PDF) (به انگلیسی).
- ↑ Hinton, Geoffrey E; Ghahramani, Zoubin; Teh, Yee Whye (2000). Solla, S. A.; Leen, T. K.; Müller, K. (eds.). Advances in Neural Information Processing Systems 12 (PDF). MIT Press. pp. 463–469.
خطای یادکرد: برچسپ <ref>
که با نام «:1» درون <references>
تعریف شده، در متن قبل از آن استفاده نشده است.