الگوریتم زوکر
الگوریتم جستجوی زوکر Zuker-Algorithmus ساختار ساختار دوم بهینهٔ یک توالی RNAکه دارای کمترین مقدار انرژی است را تحت یک مدل ترمودینامیکی محاسبه میکند. بنابراین این الگوریتم یک الگوریتم پیشگویی ساختار دوم RNA است. الگوریتم روش برنامه نویسی پویا را به کار میبرد و در سال ۱۹۸۱ چاپ شدهاست. برنامهٔ mfold پیشگویی ساختار RNA یک نسخهٔ اصلاح شده از این الگوریتم را پیادهسازی میکند.
ایده[ویرایش]
یک توالی RNA داده شده میتواند در ترکیبهای ممکن بسیاری از جفت بازها به هم پیچیده شود و ساختار تشکیل دهد که به تعداد نمایی میتوان از این ساختارهای دوم مختلف داشت. هنگامی که ساختار پیشبینی میشود از طریق فضای جستجو توسط یک پارامتر خاص بهینه میشود. برای مثال ساختار با ماکزیمم تعداد جفت بازها انتخاب شدهاست. با این وجود این ساختار میتواند از نظر بیوشیمیایی و بیولوژیکی غیرواقعی باشد. چون برای مثال ساختار شامل یک حلقهٔ سنجاق سری (hairpinloop) با فقط یک باز جفت نشدهاست یا یک ساختاری است که از نظر انرژی بسیار ناپایدار است.
معیار معنیدار بودن بیولوژیکی در نظر گرفتن انرژی آزاد یک ساختار دوم است. انرژی آزاد یک ساختار کمتر از انرژی آزاد ساختار دیگری باشد، آن ساختار پایدارتر از دومی است. تحت شرایط آزمایشگاهی، میتوان انرژی آزاد ساختارهای مختلف یک ساختار دوم RNA را اندازهگیری کرد. یک مثال از چنین جمعآوری دادهها[۱] ارائه شدهاست.مثلاً انرژی آزاد تشکیل پیوندهای بازی مختلف در یک جدول جمعآوری شدهاست. سپس با استفاده از این دادهها، میتوان انرژی آزاد یک ساختار دوم RNA را از روی توالی RNA داده شده تقریب زد.
الگوریتم در حال حاضر برای یک توالی RNA، ساختار با حداقل انرژی آزاد را محاسبه میکند. ساختار دوم بهینه در این مدل از نظر کارشناسان (زیست شناسان، بیوشیمی دانها) با ارزیابی بیولوژیکی واقع بینانه به دست میآید.
الگوریتم[ویرایش]
توالی RNA با نشان داده شده طوریکه . مینیمم انرژی آزاد یک ساختار دوم بهینه به صورت بازگشتی برای همهٔ زیرتوالیهای محاسبه شدهاست. ماتریس در درایههای مقدار مینیم انرژی آزاد (mfe) را برای توای ناقص از توالی s ذخیره میکند و ماتریس مقدار mfe ساختار توالی جزئی (ناقص) را در درایههای ذخیره میکند در جایی که و یک جفت باز هستند(پیوند بازی دارند).
مقداردهی اولیه:
مولکولهای RNA کوتاه ساختار دوم پایداری تشکیل نمیدهند.
رابطهٔ بازگشتی:
تجزیه و تحلیل در نظر گرفته شده چهار مورد است: در مورد اول و دوم ساختار بهینهٔ از توالیهای ناقص و و یک باز جفت نشده باهم در سمت چپ و راست به دست میآید. در هر دو مورد mfe تغییر نخواهد کرد.
در مورد سوم ساختار بهینه برای توسط ساختارهای بهینهٔ قسمتهایی از توالی که به هم متصل شدهاند، به دست میآید. کمترین مقدار انرژی آزاد (mfe) مجموع mfeهای ساختارهای ناقص یا است.
چهارمین مورد mfe برای توالی جزئی محاسبه شده درجایی که بازهای و نشان دهندهٔ جفت بازها هستند. اگر و نتوانند یک جفت باز تشکیل دهند سپس قرار میدهیم:
در غیر این صورت به صورت زیر محاسبه میشود:
تابع انرژی آزاد برای یک حلقهٔ سنجاق سری توالی جزئی (ناقص) است. به عنوان مثال، مقادیر حلقههای با اندازهٔ مختلف و جفت بازها میتوانند بهطور تجربی تحت شرایط یکنواخت تعیین شوند، و در یک جدول کمکی ذخیره شوند. تابع یک نمایندهاست و انرژی آزاد یک حلقهٔ داخلی (internal loop)، یک حلقهٔ بالج (bulge loop) یا یک ناحیهٔ استکی (stacking region)را میدهد که در آن دنبالهٔ جزئی دخالت دارند. در این مورد mfe مجموع mfe این ساختار و توالی ناقص است, که باید با یک جفت باز محاط شود. مورد چهارم یک ساختار شاخهای از ساختاری که به صورت بازگشتی ایجاد شده را مدل میکند.
برگشت به عقب: بعد از محاسبهٔ ماتریس بازگشتی، mfe برای توالی کامل RNA تحت یک ساختار دوم بهینه در درایهٔ ذخیره شدهاست. برای تعیین ساختار دوم بهینه mfe بهینه باید از طریق روش برگشت به عقب به دست آید.
پیچیدگی[ویرایش]
این دو جدول و مربعی هستند، بنابراین نیاز به حافظه دارند. بهینه شدن تحت تحلیل برای حلقههای درونی دو متغیر نیاز دارد که برای هر خانه در یک پیادهسازی معمولی نیاز است. از طریق یک پیش پردازش هوشمند، مقادیر حلقههای درونی قبل از محاسبه میتواند تعیین شود، همچنین این توزیع انرژی در زمان خطی انجام میشود. بهطور دلخواه میتوانید اندازهٔ حلقهها را با یک مقدار ثابت محدود کنید، پس زمان اجرای الگوریتم است.
حالت نمایش[ویرایش]
حالت نمایش در هنگام به دست آوردن برگشتی میتواند به صورت خلاصه و فشردهای فرمول بندی شود طوریکه ساختار دوم به صورت نقطه-پرانتز نمایش داده شود همان گونه که بهطور مثال در Vienna-string به دست میآید. به این صورت که یک نقطه نمایش دهندهٔ یک باز جفت نشده یا تنها است و یک پرانتز باز و بسته نشان دهندهٔ یک پیوند بازی (یا یک جفت باز)بهطوریکه حالت نمایش بازگشت به صورت زیر است:
کل ساختار دوم یک زیررشته نامیده میشود و و زیرساختارهای نامیده میشوند.
این توضیحات معادل با نمودار زیر است:
-
i , j پیوند بازی دارند
-
منشعب
برگشت به عقب[ویرایش]
الگوریتم برگشت به عقب میتواند به دلایل تفاوت موارد الگوریتم زوکر، چندین مسیر برگشتی مختلف برای نمایش یک ساختار دوم یکسان بدهد. حالتهای تمایز و نمایش از نظر معنایی مبهم هستند. برای مثال یک بازگشت از مورد 1 به مورد 2 در مورد 1،همان ساختاری را تولید میکند که بازگشت از مورد 1 به مورد 1 در مورد 2 تولید میکند. برای دیدن مثال دیگر این لینک را ببینید.[۲].
این ابهام در مورد مسئله پیدا کردن ساختار دوم بهینه مشکل ساز است. با این حال صرف گذراندن و شمارش همهٔ ساختارهای دوم مشابه از نظر بهینگی یا شمارش یا انتشار همه زیرساختارهای کمتر از حد مطلوب، الگوریتم برگشت به عقب حداقل فقط به سختی به صورت درست و کامل و کارا پیادهسازی میشود. در یک پیادهسازی استاندارد برگشت به عقب، ساختارهای برکنار شده در یک تعداد نمایی شمرده شدهاند یا نمایش داده شدهاند.
علامتگذاری[ویرایش]
این الگوریتم در مقایسه با الگوریتم ناسینوف یک جدول اضافی را به کار می برد. تا یک دنباله از بازهای جفت شده (یعنی یک ناحیهٔ stacking) بتواند به صورت متفاوتی ارزیابی شود.الگوی مشابهی نیز الگوریتم Gotohرا برای محاسبه فاصله دو هم ترازی دنباله برای گسترش گپ تکراری به کار می برد.
الگوریتم ناسینوف در سال 1987، ساختار دوم یک توالی از ورودی RNA که بیشترین تعداد جفت بازها را دارد را محاسبه کرد. چون این ساختارها از نظر بیولوژیکی لزوماً معنی دار نیستند، الگوریتم ناسینوف در عمل قابل اعمال نیست. در عمل الگوریتمهایی برای پیشگویی ساختار دوم RNA به کار برده میشوند که ساختاری با مینیمم مقدار انرژی آزاد را محاسبه میکنند یا ساختارهایی با کمترین انرژی آزاد که انرژی آنهااز یک آستانهٔ معینی بیشتر نیست را محاسبه میکنند. کاربرد الگوریتم mfold زوکر در پیادهسازی هنوز هم گسترش دارد. هر چند در حال حاضر نیز الگوریتمهای پیشبینی ساختار دوم، که یک تحلیل موردی جزئی می سازند و تمایز موارد مبهم نیست. یک نمونه از چنین الگوریتم mfe بهبود یافته Wuchty98 algorithm است.
منابع[ویرایش]
- ↑ «Index of /zukerm/rna/energy». بایگانیشده از اصلی در ۴ آوریل ۲۰۰۸. دریافتشده در ۲۹ ژوئن ۲۰۱۲.
- ↑ Algorithms for RNA secondary structure analysis : prediction of pseudoknots and the consensus shapes approach (PUB - Publications at Bielefeld University)