بلوسام

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
ماتریس بلوسام۶۲.

ماتریس‌های بلوسام (BLOSUM) (بلوک‌های ماتریس جایگزینی آمینو اسید) یک ماتریس جایگزینی است که در هم‌تراز کردن توالی‌های پروتئینی استفاده می‌شود.

ماتریس بلوسام به هم ترازی بین پروتئین‌هایی که طی تکامل از هم جدا شده‌اند، امتیاز اختصاص میدهد.پایهٔ آنها بر اساس همترازی محلی میباشد.، ماتریس بلوسام برای اولین بر در مقاله‌ای توسط Henikoff معرفی شد.آنها پایگاه دادهٔ بلوک‌ها را برای پیدا کردن مناطق حفاظت شده در پروتئین‌ها پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانس‌های آمینو اسیدهای مرتبط و احتمال‌های جایگزینی را به دست آوردند.سپس امتیاز لوجیت هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند.بر خلاف ماتریس‌های PAM که بر پایه مقایسه بین پروتئین نزدیک برون‌یابی می‌شود، ماتریس‌های بلوسام بر پایهٔ هم ترازی‌های مشاهده‌ای ساخته شده‌است.

ماتریس‌های بلوسام بسیاری وجود دارند که با اعداد نام گذاری میشوند و اختلافشان در پایگاه داده‌های همترازی متفاوت است.ماتریس‌های بلوسام نام گذاری شده با عدد بزرگ برای مقایسهٔ دنباله‌های بسیار مرتبط استفاده شده در حالی که ماتریس‌های با عدد کوچک به مقایسه دنباله‌های دور می‌پردازد. به طور مثال BLOSUM۸۰ برای دنباله‌هایی که از هم خیلی دور نیستند و BLOSUM۴۵ برای دنباله‌های دور از هم استفاده میشوند.ماتریس‌ها توسط ادغام کردن همهٔ دنباله‌هایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنباله‌ها را مقایسه میکند.درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنباله‌هایی با یکسانی بیش از ۸۰ درصد تولید می‌شود.

امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت درست‌نمایی دو آمینو اسید که بیولوژیکی ظاهر شده‌اند به درست‌نمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شده‌اند، محاسبه میشود.مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه می‌دهد.

تساوی زیر برای محاسبه ماتریس BLOSUM استفاده می‌شود:

S_{ij}= \left(\frac{1}{\lambda} \right)\log{\left(\frac{p_{ij}}{q_i * q_j} \right)}

در اینجا p_{ij} احتمال جابجا شدن دو آمینو اسید i و j در دنباله‌های مشابه (آنالوگ) و q_i و q_j احتمال رخ دادن آمینو اسید i و j به صورت تصادفی در دنباله پروتیین‌ها میباشد.به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور \lambda استفاده میکنیم. مقاله‌ای در Nature Biotechnology نشان داد کهBLOSUM۶۲ سالیان سال به عنوان استاندارد استفاده می‌شود، طبق الگوریتم هنیکوف دقیقاً صحیح نیست.در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا می‌دهد.

جستارهای وابسته[ویرایش]

پیوند به بیرون[ویرایش]