لم پمپاژ برای زبان‌های منظم

از ویکی‌پدیا، دانشنامهٔ آزاد

در نظریهٔ زبان‌های صوری، لم پمپاژ برای زبان‌های منظم یک ویژگی ضروری برای همهٔ زبان‌های منظم را توصیف می‌کند. به‌طور غیر صوری، بیان می‌کند که هر کلمهٔ به اندازهٔ کافی بزرگ در یک زبان منظم می‌تواند پمپاژ شود — یعنی یک قسمت میانی کلمه به تعداد دل‌خواه تکرار شود — تا کلمهٔ جدیدی ایجاد شود که همچنین در همان زبان قرار گیرد.

مخصوصا لم پمپاژ بیان می‌کند که برای هر زبان منظم L یک عدد ثابت p وجود دارد به‌طوری‌که هر کلمه w در L با طول حداقل p می‌تواند به سه زیر رشته تقسیم شود، w = xyz، که در آن بخش میانی y خالی نیست، طوری‌که کلمه‌های xz، xyz، xyyz، xyyyz، ... ساخته شده با به تعداد دل‌خواه بار تکرار y (شامل صفر بار) باز هم در L باشند. این فرایند تکرار به «پمپاژ» معروف است. علاوه بر این، لم پمپاژ تضمین می‌کند که طول xy حداکثر p خواهد بود، که این محدودیتی بر راه‌هایی که w می‌تواند تقسیم شود تحمیل می‌کند. زبان‌های متناهی به وضوح لم پمپاژ را با قرار دادن p برابر طول بیشترین رشته در L به اضافهٔ یک ارضا می‌کنند.

لم پمپاژ اولین بار توسط دانا اسکات و مایکل رابین در ۱۹۵۹ اثبات شد.[۱] این لم برای رد کردن خاصیت منظم بودن یک زبان خاص مورد سؤال کاربرد دارد. این لم یکی از معدود لم‌های پمپاژ است، که هر کدام قصد مشابهی دارند.

شرح صوری[ویرایش]

فرض می‌کنیم L یک زبان منظم باشد. در این صورت عدد صحیح p ≥ 1 تنها وابسته به L وجود دارد طوری‌که هر رشتهٔ w در L با طول حداقل p (به p طول پمپاژ گفته می‌شود) می‌تواند به صورت w = xyz نوشته شود (w می‌تواند به سه زیررشته تقسیم شود)، طوری‌که شرط‌های زیر را ارضا کند:

  1. |y| ≥ 1;
  2. |xy| ≤ p
  3. for all i ≥ 0, xyizL

y زیر رشته‌ای است که می‌تواند پمپاژ شود (حذف شود یا به به هر تعداد بار تکرار شود، و رشتهٔ حاصل در هر حال در L باشد). (۱) به این معنی است که طول لوپ y که پمپاژ می‌شود باید حداقل یک باشد. (۲) به این معنی است که لوپ y باید در p کاراکتر اول واقع باشد. |x| باید کوچکتر از p باشد (نتیجهٔ (۱) و (۲))، غیر از این دیگر هیچ محدودیتی بر روی x و z وجود ندارد.

به زبان ساده، برای هر زبان منظم L، هر کلمهٔ به اندازهٔ کافی بزرگ (در L) می‌تواند به ۳ قسمت تقسیم شود. مثلاً w = xyz، طوری‌که همهٔ رشته‌های xykz برای هر k≥0 هم در L باشند.

در زیر یک صورت‌بندی صوری لم پمپاژ آمده‌است:

کاربرد لم[ویرایش]

لم پمپاژ معمولاً برای اثبات نامنظم بودن یک زبان خاص مورد استفاده قرار می‌گیرد. یک اثبات به وسیلهٔ برهان خلف می‌تواند شامل یک کلمه (با طول خواسته شده) در زبان باشد که فاقد خاصیت بیان شده در لم پمپاژ است.

به‌طور مثال زبان {L = {anbn : ≥ 0 روی الفبای {Σ = {a, b می‌تواند به روشی که در ادامه می‌آید اثبات شود که نامنظم است. فرض کنید w، x، y، z، p و i همان متغیرهایی باشند که در صورت لم پمپاژ در بالا استفاده شدند. فرض کنید w در L به صورت w = apbp داده شده باشد. با استفاده از لم پمپاژ، باید یک تجزیه w = xyz با xy| ≤ p| و y| ≥ 1| وجود داشته باشد طوری‌که xyiz به ازای هر i در L باشد. با استفاده از xy| ≤ p| می‌دانیم که y فقط شامل نمونه‌های a است. علاوه بر این، چون y| ≥ 1|، شامل حداقل یک نمونه از a است. حال y را پمپاژ می‌کنیم: xy2z دارای نمونه‌های بیشتری از حرف a نسبت به حرف b است، زیرا ما تعدادی نمونهٔ a بدون اضافه کردن نمونه‌ای از b اضافه کردیم. بنابراین xy2z در L نیست. پس به تناقض رسیدیم. از این رو، این فرض که L منظم است باید نادرست باشد. پس L منظم نیست.

اثبات لم پمپاژ[ویرایش]

برای هر زبان منظم یک ماشین حالات متناهی (FSA) وجود دارد که آن زبان را می‌پذیرد. تعداد حالات در چنین ماشین حالات متناهی‌ای شمرده می‌شود و این تعداد به عنوان طول پمپاژ p استفاده می‌شود. برای یک رشته به طول حداقل p، فرض کنید s0 حالت آغازین و s1, ..., sp ترتیب p حالت بعدی باشد که در فرایند تولید رشته طی می‌شوند. از آن‌جا که FSA تنها p حالت دارد، در این دنباله که در آن p+1 حالت طی شده‌است باید حداقل یک حالت وجود داشته باشد که تکرار شده‌است. نام این حالت را S می‌گذاریم. انتقالاتی که ماشین را از اولین مواجهه با S به دومین مواجهه با S می‌برند با یک رشته تطابق دارند. این رشته در لم y نامیده می‌شود، و از آن‌جایی که ماشین بدون بخش y به یک رشته می‌رسد، یا رشتهٔ y می‌تواند به تعداد دل‌خواه بار تکرار شود، شرط‌های لم ارضا می‌شوند.

به‌طور مثال شکل زیر یک FSA را نشان می‌دهد:

FSA رشتهٔ abcd را می‌پذیرد. از آن‌جا که این رشته طولی دارد که حداقل به اندازهٔ تعداد حالات است، اصل لانه کبوتری نشان می‌دهد که باید حداقل یک حالت تکراری بین حالت آغازین و ۴ حالت بعدی وجود داشته باشد. در این مثال فقط q1 حالت تکراری است. از آن‌جا که زیر رشتهٔ bc ماشین را درون انتقالاتی که در حالت q1 شروع می‌شوند و در حالت q1 تمام می‌شوند می‌برد، این قسمت می‌تواند با دادن رشتهٔ abcbcd تکرار شود و FSA هنوز می‌پذیرد. متناوباً، قسمت bc می‌تواند حذف شود و FSA کماکان دادن رشتهٔ ad را می‌پذیرد. در عبارات لم پمپاژ، رشتهٔ abcd شکسته شده به یک قسمت x که a است، یک قسمت y که bc است و یک قسمت z که d است.

نسخهٔ کلی لم پمپاژ برای زبان‌های منظم[ویرایش]

اگر یک زبان L منظم باشد، یک عدد p ≥ 0 (طول پمپاژ) وجود دارد به‌طوری‌که هر رشتهٔ uwv در L با w| ≥ p| می‌تواند به فرم

uwv = uxyzv

نوشته شودبا رشته‌های y ،x و z طوری‌که xy| ≤ p ، |y| ≥ 0| و

uxyiz به ازای هر i در L باشد.[۲]

این نسخه از لم می‌تواند در اثبات نامنظم بودن زبان‌های بیشتری مورد استفاده قرار بگیرد، زیرا شرایط سختگیرانه‌تری را روی زبان تحمیل می‌کند.

عکس لم صحیح نیست[ویرایش]

در نظر داشته باشید با این که لم پمپاژ بیان می‌کند که هر زبان منظم شرایط بالا را ارضا می‌کنند، عکس این گزاره صحیح نیست: یک زبان که این شرایط را ارضا می‌کند ممکن است نامنظم باشد. به بیان دیگر، هر دو نسخهٔ اصلی و کلی لم پمپاژ یک شرط لازم و نه کافی را برای منظم بودن زبان ارائه می‌کنند.

به‌طور مثال زبان L زیر را در نظر بگیرید:

.

به بیان دیگر، L شامل همهٔ رشته‌ها روی الفبای {0,1،2,3} با یک زیر رشتهٔ به طول 3 شامل یک حرف تکراری است، و همچنین رشته‌هایی که دقیقاً 1/7 کاراکترهای آن رشته 3 باشند. این زبان منظم نیست ولی با این حال هنوز می‌تواند با p = 5 «پمپاژ» شود. یک رشتهٔ s با طول حداقل 5 را در نظر بگیرید. سپس از آن‌جا که الفبا فقط 4 حرف دارد، حداقل دو تا از پنج حرف رشته باید تکراری باشند. آن‌ها با حداکثر سه حرف از هم جدا شده‌اند.

  • اگر حرف‌های تکراری با 0 یا 1 حرف جدا شده باشند، یکی از دو حرف دیگر را که تأثیری روی زیررشته‌ای که شامل حروف تکراری است نداشته باشد پمپاژ می‌کنیم.
  • اگر حروف تکراری با 2 یا 3 حرف جدا شده باشند، دو تا از حروفی که آن‌ها را از هم جدا می‌کند پمپاژ می‌کنیم. پمپاژ کردن بالا یا پایین یک زیررشته به طول 3 می‌سازد که که شامل دو حرف تکراری است.
  • دومین شرط L تضمین می‌کند که L منظم نیست: به عنوان مثال، بی‌نهایت رشته در L وجود دارند که نمی‌توان با پمپاژ کردن یک رشتهٔ کوچک‌تر آن‌ها را به دست آورد.

برای یک آزمایش عملی که دقیقاً زبان‌های منظم را مشخص می‌کند، نظریهٔ مایهیل-نروده را مشاهده کند. روش بارز برای اثبات منظم بودن یک زبان ساختن یک ماشین حالات متناهییا یک عبارت منظمبرای آن زبان است.

جستارهای وابسته[ویرایش]

پانوشته‌ها[ویرایش]

  1. Scott, Dana; Rabin, Michael (1959). "Finite Automata and Their Decision Problems". IBM Journal of Research and Development. 5 (2): 114–125.
  2. Savitch, Walter (1982). Abstract Machines and Grammars. p. 49. ISBN 0-316-77161-9.

منابع[ویرایش]

Wikipedia contributors, "Pumping lemma for regular languages," Wikipedia, The Free Encyclopedia, http://en.wikipedia.org/w/index.php?title=Pumping_lemma_for_regular_languages&oldid=607161557 (accessed May 21, 2014).