لم تزریق برای زبانهای منظم
در نظریهٔ زبانهای صوری، لم تزریق برای زبانهای منظم یک ویژگی ضروری برای همهٔ زبانهای منظم را توصیف میکند. بهطور غیر صوری، بیان میکند که هر کلمهٔ به اندازهٔ کافی بزرگ در یک زبان منظم میتواند تزریق شود — یعنی یک قسمت میانی کلمه به تعداد دلخواه تکرار شود — تا کلمهٔ جدیدی ایجاد شود که همچنین در همان زبان قرار گیرد.
مخصوصا لم تزریق بیان میکند که برای هر زبان منظم L یک عدد ثابت p وجود دارد بهطوریکه هر کلمه w در L با طول حداقل p میتواند به سه زیر رشته تقسیم شود، w = xyz، که در آن بخش میانی y خالی نیست، طوریکه کلمههای xz، xyz، xyyz، xyyyz، ... ساخته شده با به تعداد دلخواه بار تکرار y (شامل صفر بار) باز هم در L باشند. این فرایند تکرار به «تزریق» معروف است. علاوه بر این، لم تزریق تضمین میکند که طول xy حداکثر p خواهد بود، که این محدودیتی بر راههایی که w میتواند تقسیم شود تحمیل میکند. زبانهای متناهی به وضوح لم تزریق را با قرار دادن p برابر طول بیشترین رشته در L به اضافهٔ یک ارضا میکنند.
لم تزریق اولین بار توسط دانا اسکات و مایکل رابین در ۱۹۵۹ اثبات شد.[۱] این لم برای رد کردن خاصیت منظم بودن یک زبان خاص مورد سؤال کاربرد دارد. این لم یکی از معدود لمهای تزریق است، که هر کدام قصد مشابهی دارند.
شرح صوری
[ویرایش]فرض میکنیم L یک زبان منظم باشد. در این صورت عدد صحیح p ≥ 1 تنها وابسته به L وجود دارد طوریکه هر رشتهٔ w در L با طول حداقل p (به p طول تزریق گفته میشود) میتواند به صورت w = xyz نوشته شود (w میتواند به سه زیررشته تقسیم شود)، طوریکه شرطهای زیر را ارضا کند:
- |y| ≥ 1;
- |xy| ≤ p
- for all i ≥ 0, xyiz ∈ L
y زیر رشتهای است که میتواند تزریق شود (حذف شود یا به به هر تعداد بار تکرار شود، و رشتهٔ حاصل در هر حال در L باشد). (۱) به این معنی است که طول لوپ y که تزریق میشود باید حداقل یک باشد. (۲) به این معنی است که لوپ y باید در p کاراکتر اول واقع باشد. |x| باید کوچکتر از p باشد (نتیجهٔ (۱) و (۲))، غیر از این دیگر هیچ محدودیتی بر روی x و z وجود ندارد.
به زبان ساده، برای هر زبان منظم L، هر کلمهٔ به اندازهٔ کافی بزرگ (در L) میتواند به ۳ قسمت تقسیم شود. مثلاً w = xyz، طوریکه همهٔ رشتههای xykz برای هر k≥0 هم در L باشند.
در زیر یک صورتبندی صوری لم تزریق آمدهاست:
کاربرد لم
[ویرایش]لم تزریق معمولاً برای اثبات نامنظم بودن یک زبان خاص مورد استفاده قرار میگیرد. یک اثبات به وسیلهٔ برهان خلف میتواند شامل یک کلمه (با طول خواسته شده) در زبان باشد که فاقد خاصیت بیان شده در لم تزریق است.
بهطور مثال زبان {L = {anbn : ≥ 0 روی الفبای {Σ = {a, b میتواند به روشی که در ادامه میآید اثبات شود که نامنظم است. فرض کنید w، x، y، z، p و i همان متغیرهایی باشند که در صورت لم تزریق در بالا استفاده شدند. فرض کنید w در L به صورت w = apbp داده شده باشد. با استفاده از لم تزریق، باید یک تجزیه w = xyz با xy| ≤ p| و y| ≥ 1| وجود داشته باشد طوریکه xyiz به ازای هر i در L باشد. با استفاده از xy| ≤ p| میدانیم که y فقط شامل نمونههای a است. علاوه بر این، چون y| ≥ 1|، شامل حداقل یک نمونه از a است. حال y را تزریق میکنیم: xy2z دارای نمونههای بیشتری از حرف a نسبت به حرف b است، زیرا ما تعدادی نمونهٔ a بدون اضافه کردن نمونهای از b اضافه کردیم. بنابراین xy2z در L نیست. پس به تناقض رسیدیم. از این رو، این فرض که L منظم است باید نادرست باشد. پس L منظم نیست.
اثبات لم تزریق
[ویرایش]برای هر زبان منظم یک ماشین حالات متناهی (FSA) وجود دارد که آن زبان را میپذیرد. تعداد حالات در چنین ماشین حالات متناهیای شمرده میشود و این تعداد به عنوان طول تزریق p استفاده میشود. برای یک رشته به طول حداقل p، فرض کنید s0 حالت آغازین و s1, ..., sp ترتیب p حالت بعدی باشد که در فرایند تولید رشته طی میشوند. از آنجا که FSA تنها p حالت دارد، در این دنباله که در آن p+1 حالت طی شدهاست باید حداقل یک حالت وجود داشته باشد که تکرار شدهاست. نام این حالت را S میگذاریم. انتقالاتی که ماشین را از اولین مواجهه با S به دومین مواجهه با S میبرند با یک رشته تطابق دارند. این رشته در لم y نامیده میشود، و از آنجایی که ماشین بدون بخش y به یک رشته میرسد، یا رشتهٔ y میتواند به تعداد دلخواه بار تکرار شود، شرطهای لم ارضا میشوند.
بهطور مثال شکل زیر یک FSA را نشان میدهد:
FSA رشتهٔ abcd را میپذیرد. از آنجا که این رشته طولی دارد که حداقل به اندازهٔ تعداد حالات است، اصل لانه کبوتری نشان میدهد که باید حداقل یک حالت تکراری بین حالت آغازین و ۴ حالت بعدی وجود داشته باشد. در این مثال فقط q1 حالت تکراری است. از آنجا که زیر رشتهٔ bc ماشین را درون انتقالاتی که در حالت q1 شروع میشوند و در حالت q1 تمام میشوند میبرد، این قسمت میتواند با دادن رشتهٔ abcbcd تکرار شود و FSA هنوز میپذیرد. متناوباً، قسمت bc میتواند حذف شود و FSA کماکان دادن رشتهٔ ad را میپذیرد. در عبارات لم تزریق، رشتهٔ abcd شکسته شده به یک قسمت x که a است، یک قسمت y که bc است و یک قسمت z که d است.
نسخهٔ کلی لم تزریق برای زبانهای منظم
[ویرایش]اگر یک زبان L منظم باشد، یک عدد p ≥ 0 (طول تزریق) وجود دارد بهطوریکه هر رشتهٔ uwv در L با w| ≥ p| میتواند به فرم
- uwv = uxyzv
نوشته شودبا رشتههای y ،x و z طوریکه xy| ≤ p ، |y| ≥ 0| و
- uxyiz به ازای هر i در L باشد.[۲]
این نسخه از لم میتواند در اثبات نامنظم بودن زبانهای بیشتری مورد استفاده قرار بگیرد، زیرا شرایط سختگیرانهتری را روی زبان تحمیل میکند.
عکس لم صحیح نیست
[ویرایش]در نظر داشته باشید با این که لم تزریق بیان میکند که هر زبان منظم شرایط بالا را ارضا میکنند، عکس این گزاره صحیح نیست: یک زبان که این شرایط را ارضا میکند ممکن است نامنظم باشد. به بیان دیگر، هر دو نسخهٔ اصلی و کلی لم تزریق یک شرط لازم و نه کافی را برای منظم بودن زبان ارائه میکنند.
بهطور مثال زبان L زیر را در نظر بگیرید:
.
به بیان دیگر، L شامل همهٔ رشتهها روی الفبای {0,1،2,3} با یک زیر رشتهٔ به طول 3 شامل یک حرف تکراری است، و همچنین رشتههایی که دقیقاً 1/7 کاراکترهای آن رشته 3 باشند. این زبان منظم نیست ولی با این حال هنوز میتواند با p = 5 «تزریق» شود. یک رشتهٔ s با طول حداقل 5 را در نظر بگیرید. سپس از آنجا که الفبا فقط 4 حرف دارد، حداقل دو تا از پنج حرف رشته باید تکراری باشند. آنها با حداکثر سه حرف از هم جدا شدهاند.
- اگر حرفهای تکراری با 0 یا 1 حرف جدا شده باشند، یکی از دو حرف دیگر را که تأثیری روی زیررشتهای که شامل حروف تکراری است نداشته باشد تزریق میکنیم.
- اگر حروف تکراری با 2 یا 3 حرف جدا شده باشند، دو تا از حروفی که آنها را از هم جدا میکند تزریق میکنیم. تزریق کردن بالا یا پایین یک زیررشته به طول 3 میسازد که که شامل دو حرف تکراری است.
- دومین شرط L تضمین میکند که L منظم نیست: به عنوان مثال، بینهایت رشته در L وجود دارند که نمیتوان با تزریق کردن یک رشتهٔ کوچکتر آنها را به دست آورد.
برای یک آزمایش عملی که دقیقاً زبانهای منظم را مشخص میکند، نظریهٔ مایهیل-نروده را مشاهده کند. روش بارز برای اثبات منظم بودن یک زبان ساختن یک ماشین حالات متناهییا یک عبارت منظمبرای آن زبان است.
جستارهای وابسته
[ویرایش]پانوشتهها
[ویرایش]- ↑ Scott, Dana; Rabin, Michael (1959). "Finite Automata and Their Decision Problems". IBM Journal of Research and Development. 5 (2): 114–125.
- ↑ Savitch, Walter (1982). Abstract Machines and Grammars. p. 49. ISBN 0-316-77161-9.