له‌نت

از ویکی‌پدیا، دانشنامهٔ آزاد

له نت (LeNet) یک ساختار شبکه عصبی کانولوشن است که توسط Yann LeCun و همکاران در سال ۱۹۸۹ پیشنهاد شده‌است. به‌طور کلی، له نت (LeNet) به lenet-5 اشاره دارد و یک شبکه عصبی کانولوشن ساده است. شبکه‌های عصبی کانولوشن نوعی شبکه عصبی پیش خور هستند که در ان نورون‌های مصنوعی می‌توانند به بخشی از سلول‌های اطراف در محدوده پوشش پاسخ دهند و در پردازش تصویر در مقیاس بزرگ عملکرد خوبی داشته باشند.

تاریخچه توسعه[ویرایش]

lenet-5 یکی از اولین شبکه‌های عصبی کانولوشن بود و توسعه یادگیری عمیق را ارتقا داد. از سال ۱۹۸۸، پس از سالها تحقیق و تکرارهای موفقیت‌آمیز بسیاری، کار پیشگامان LeNet5 نامگذاری شده‌است. در سال ۱۹۸۹، یان لکون و همکاران در آزمایشگاه‌های بل ابتدا الگوریتم انتشار مجدد را در کاربردهای عملی اعمال کرد و معتقد بود که با یادگیری محدودیت‌های دامنه کار، توانایی یادگیری تعمیم شبکه تا حد زیادی افزایش می‌یابد. او یک شبکه عصبی کانولوشن آموزش دیده را ترکیب کرد که توسط الگوریتم‌های انتشار مجدد برای خواندن شماره‌های دست‌نویس آموزش داده شده و با موفقیت آن را در شناسایی شماره‌های کد پستی دست‌نویس ارائه شده توسط سرویس پستی ایالات متحده اعمال کرد. این نمونه اولیه چیزی بود که بعداً له نت (LeNet) نام گرفت. در همان سال، LeCun در مقاله دیگری یک مسئله کوچک شناسایی رقمی دست‌نویس را توصیف کرد و نشان داد که حتی اگر این مسئله به صورت خطی قابل تفکیک باشد، شبکه‌های تک لایه قابلیت‌های ضعیف تعمیم را به نمایش می‌گذارند. هنگام استفاده از آشکارسازهای ویژگی تغییرناپذیر در یک شبکه چند لایه و محدود، مدل می‌تواند عملکرد بسیار خوبی داشته باشد. وی معتقد بود که این نتایج ثابت می‌کند که به حداقل رساندن تعداد پارامترهای آزاد در شبکه عصبی می‌تواند توانایی تعمیم شبکه عصبی را افزایش دهد. در سال ۱۹۹۰، مقاله آنها کاربرد شبکه‌های انتشار مجدد در شناسایی رقمی دست‌نویس را دوباره توصیف کرد. آنها فقط پیش پردازش حداقل داده‌ها را انجام دادند و مدل با دقت برای این کار طراحی شده و بسیار محدود بود. داده‌های ورودی شامل تصاویر، هر یک حاوی یک عدد بود، و نتایج آزمون داده‌های دیجیتال کد پستی ارائه شده توسط سرویس پستی ایالات متحده نشان که مدل فقط دارای نرخ خطا ۱درصد و میزان رد در حدود ۹درصد بود. تحقیقات آنها برای هشت سال آینده ادامه داشت و در سال ۱۹۹۸، یان لکون، لئون بوتو، یوشوا بنگیو و پاتریک هافنر روش‌های مختلف شناسایی شخصیت دست‌نویس را در کاغذ بررسی کردند و از ارقام دست‌نویس استاندارد برای شناسایی وظایف معیار استفاده کردند. این مدل‌ها مقایسه شده و نتایج آنها نشان داد که این شبکه از همه مدل‌های دیگر بهتر عمل کرده‌است. آنها همچنین نمونه‌هایی از کاربردهای عملی شبکه‌های عصبی، مانند دو سیستم برای شناسایی شخصیت‌های دست‌نویس به‌صورت آنلاین و مدل‌هایی که می‌توانند میلیون‌ها چک در روز را بخوانند، ارائه کردند. این تحقیق موفقیت زیادی کسب کرده و علاقه محققان را به مطالعه شبکه‌های عصبی برانگیخته است. با این وجود که امروزه معماری شبکه‌های عصبی با بهترین عملکرد باز هم همانند شبکه له نت (LeNet) نیست، این شبکه نقطه شروع تعداد زیادی از معماری‌های شبکه عصبی بود و همچنین باعث ایجاد انگیزه در این زمینه شد.

ساختار[ویرایش]

له نت (LeNet) به عنوان نماینده شبکه عصبی کانولوشن اولیه، دارای واحدهای اساسی شبکه عصبی کانولوشن است، مانند لایه کانولوشن، لایه استخر و لایه اتصال کامل، و پایه ای برای توسعه آینده شبکه عصبی کانولوشن. lenet-5 از هفت لایه تشکیل شده‌است که علاوه بر ورودی، هر لایه دیگر می‌تواند پارامترها را آموزش دهد.

امکانات[ویرایش]

-هر لایه کانولوشن شامل سه قسمت است: توابع کانولوشن، جمع کردن و فعال سازی غیرخطی. -استفاده از کانولوشن برای استخراج ویژگی‌های فضایی (در ابتدا Convolution را زمینه‌های پذیرا می‌نامیدند). -نمونه برداری از لایه استخر متوسط. -استفاده از MLP به عنوان آخرین طبقه‌بندی. -اتصال پراکنده بین لایه‌ها برای کاهش پیچیدگی محاسبات.

کاربرد[ویرایش]

تشخیص تصاویر ساده رقمی کلاسیک‌ترین کاربرد له نت (LeNet) است چون به همین دلیل مطرح شد. هنگامی که یان لکون، و همکاران، فرم اولیه له نت (LeNet) را در سال ۱۹۸۹ مطرح کردند. مقاله Backpropagation اعمال شده در شناسایی کد پستی دست‌نویس نشان می‌دهد که چگونه می‌توان چنین محدودیت‌هایی را از طریق معماری شبکه در یک شبکه کپی برداری ادغام کرد؛ و با موفقیت در شناسایی ارقام کد پستی دست‌نویس ارائه شده توسط سرویس پستی ایالات متحده اعمال شد.

تجزیه و تحلیل توسعه[ویرایش]

به معنای ظهور CNN (شبکه عصبی کانولوشن) است و اجزای اساسی CNN را تعریف می‌کند. اما در آن زمان به دلیل کمبود تجهیزات سخت‌افزاری محبوب نبود، به ویژه GPU (واحد پردازش گرافیک، یک مدار الکترونیکی تخصصی طراحی شده برای دستکاری سریع و تغییر حافظه برای تسریع در ایجاد تصاویر در یک بافر فریم که برای خروجی به دستگاه نمایشگر در نظر گرفته شده‌است) و الگوریتم‌های دیگر مانند SVM (پشتیبانی-ماشین بردار) می‌توانند به اثرات مشابه دست یابند یا حتی از له نت (LeNet) فراتر روند. از زمان موفقیت AlexNet در سال ۲۰۱۲، CNN به بهترین گزینه برای برنامه‌های دید رایانه تبدیل شده‌است و انواع مختلف CNN مانند سری R-CNN مطرح شده‌است.

این روزها، مدل‌های CNN کاملاً متفاوت از له نت (LeNet) هستند، ولی همه آنها بر اساس له نت (LeNet) ساخته شده‌اند.

منابع[ویرایش]

  • LeCun, Y. ; Boser, B. ; Denker, J. S. ; Henderson, D. ; Howard, R. E. ; Hubbard, W. ; Jackel, L. D. (دسامبر ۱۹۸۹). "Backpropagation Applied to Handwritten Zip Code Recognition". Neural Computation. 1 (4): 541–551. doi:10.1162/neco.1989.1.4.541. ISSN 0899-7667. S2CID 41312633
  • Lecun, Yann (ژوئن ۱۹۸۹). "Generalization and network design strategies" (PDF). Technical Report CRG-TR-89-4. Department of Computer Science, University of Toronto.