پرش به محتوا

حافظه طولانی کوتاه مدت

از ویکی‌پدیا، دانشنامهٔ آزاد

نسخه‌ای که می‌بینید نسخه‌ای قدیمی از صفحه است که توسط InternetArchiveBot (بحث | مشارکت‌ها) در تاریخ ‏۲۰ سپتامبر ۲۰۱۹، ساعت ۰۹:۴۵ ویرایش شده است. این نسخه ممکن است تفاوت‌های عمده‌ای با نسخهٔ فعلی داشته باشد.

یک بلوک ال‌اس‌تی‌ام روزنه‌ای با دروازه‌های ورودی، خروجی و فراموشی. پیکان‌های خروجی از گره ct به واقع به نشان دهنده پیکان‌های خروجی از ct-1 هستند به جز تنها پیکان راست-به-چپ. بسیاری از انواع دیگر ال‌اس‌تی‌ام‌ها هم وجود دارد.[۱]

حافظه طولانی کوتاه-مدت (به انگلیسی: Long short-term memory) یا به اختصار ال‌اس‌تی‌ام (تلفظ تحت‌اللفظی LSTM)، یک معماری شبکه عصبی بازگشتی (یک شبکه عصبی مصنوعی) است که در سال ۱۹۹۷ میلادی توسط سپ هوخرایتر و یورگن اشمیدهوبر ارائه شد،[۲] و بعداً در سال ۲۰۰۰ میلادی توسط فیلیکس ژرس و دیگران بهبود داده شد.[۳]

معماری

ال‌اس‌تی‌ام سنتی

مقادیر اولیه: و . عملگر نشان دهنده ضرب هادامارد (ضرب عنصری).

متغیرها

  • : بردار ورودی
  • : بردار خروجی
  • : بردار وضعیت سلول
  • و : ماتریس‌ها و بردار پارامتر
  • و : بردارهای دروازه
    • : بردار دروازه فراموشی. وزن به یادداری اطلاعات قدیمی.
    • : بردار دروازه ورودی. وزن اندوختن اطلاعات جدید.
    • : بردار دروازه خروجی. کاندید خروجی.

توابع فعال‌سازی

  • : تابع اصلی یک تابع سیگموئید است.
  • : تابع اصلی یک تانژانت هذلولی است.
  • : تابع اصلی یک تانژانت هذلولی است اما ال‌اس‌تی‌ام روزنه‌ای .

ال‌اس‌تی‌ام روزنه‌ای

ال‌اس‌تی‌ام روزنه‌ای با دروازه‌های فراموشی. استفاده نمی‌شود، در عوض از در بیش تر جاها استفاده می‌شود.

ال‌اس‌تی‌ام کانولوشنی

ال‌اس‌تی‌ام کانولوشنی.[۴] نشان دهنده عملگر کانولوشن است.

جستارهای وابسته

منابع

  1. Klaus Greff; Rupesh Kumar Srivastava; Jan Koutník; Bas R. Steunebrink; Jürgen Schmidhuber (2015). "LSTM: A Search Space Odyssey". arXiv:1503.04069. {{cite arxiv}}: More than one of |author1= و |author= specified (help); More than one of |eprint= و |arxiv= specified (help)
  2. Sepp HochreiterJürgen Schmidhuber (1997). "Long short-term memory"Neural Computation9 (8): 1735–1780. doi:10.1162/neco.1997.9.8.1735PMID 9377276.
  3. Felix A. Gers; Jürgen Schmidhuber; Fred Cummins (2000). "Learning to Forget: Continual Prediction with LSTM"Neural Computation12 (10): 2451–2471. doi:10.1162/089976600300015015.
  4. Xingjian Shi; Zhourong Chen; Hao Wang; Dit-Yan Yeung; Wai-kin Wong; Wang-chun Woo (2015). "Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting". Proceedings of the 28th International Conference on Neural Information Processing Systems: 802–810.

پیوند به بیرون