بلوسام
ماتریسهای بلوسام (BLOSUM) (بلوکهای ماتریس جایگزینی آمینو اسید) یک ماتریس جایگزینی است که در همتراز کردن توالیهای پروتئینی استفاده میشود.
ماتریس بلوسام به هم ترازی بین پروتئینهایی که طی تکامل از هم جدا شدهاند، امتیاز اختصاص میدهد.پایهٔ آنها بر اساس همترازی محلی میباشد.، ماتریس بلوسام برای اولین بر در مقالهای توسط Henikoff معرفی شد.آنها پایگاه دادهٔ بلوکها را برای پیدا کردن مناطق حفاظت شده در پروتئینها پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانسهای آمینو اسیدهای مرتبط و احتمالهای جایگزینی را به دست آوردند.سپس امتیاز لوجیت هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند.بر خلاف ماتریسهای PAM که بر پایه مقایسه بین پروتئین نزدیک برونیابی میشود، ماتریسهای بلوسام بر پایهٔ هم ترازیهای مشاهدهای ساخته شدهاست.
ماتریسهای بلوسام بسیاری وجود دارند که با اعداد نام گذاری میشوند و اختلافشان در پایگاه دادههای همترازی متفاوت است.ماتریسهای بلوسام نام گذاری شده با عدد بزرگ برای مقایسهٔ دنبالههای بسیار مرتبط استفاده شده در حالی که ماتریسهای با عدد کوچک به مقایسه دنبالههای دور میپردازد. به طور مثال BLOSUM۸۰ برای دنبالههایی که از هم خیلی دور نیستند و BLOSUM۴۵ برای دنبالههای دور از هم استفاده میشوند.ماتریسها توسط ادغام کردن همهٔ دنبالههایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنبالهها را مقایسه میکند.درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنبالههایی با یکسانی بیش از ۸۰ درصد تولید میشود.
امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت درستنمایی دو آمینو اسید که بیولوژیکی ظاهر شدهاند به درستنمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شدهاند، محاسبه میشود.مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه میدهد.
تساوی زیر برای محاسبه ماتریس BLOSUM استفاده میشود:
در اینجا
احتمال جابجا شدن دو آمینو اسید
و
در دنبالههای مشابه (آنالوگ) و
و
احتمال رخ دادن آمینو اسید
و
به صورت تصادفی در دنباله پروتیینها میباشد.به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور
استفاده میکنیم. مقالهای در Nature Biotechnology نشان داد کهBLOSUM۶۲ سالیان سال به عنوان استاندارد استفاده میشود، طبق الگوریتم هنیکوف دقیقا صحیح نیست.در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا میدهد.
جستارهای وابسته [ویرایش]
پیوند به بیرون [ویرایش]
- BLOSUM. (۲۰۱۱، April ۷). In Wikipedia، The Free Encyclopedia. Retrieved ۱۸:۴۸، June ۲۶، ۲۰۱۱، from http://en.wikipedia.org/w/index.php?title=BLOSUM&oldid=422872426
- Page on BLOSUM
- Sean R. Eddy (2004). "Where did the BLOSUM62 alignment score matrix come from?". Nature Biotechnology 22 (8): 1035. DOI:10.1038/nbt0804-1035. PMID 15286655.
- BLOCKS WWW server
- Scoring systems for BLAST at NCBI
- Data files of BLOSUM on the NCBI FTP server.
