بلوسام: تفاوت میان نسخه‌ها

از ویکی‌پدیا، دانشنامهٔ آزاد
محتوای حذف‌شده محتوای افزوده‌شده
Fatemehbeigi (بحث | مشارکت‌ها)
Fatemehbeigi (بحث | مشارکت‌ها)
ایجاد شده توسط ترجمهٔ صفحهٔ «BLOSUM»
خط ۱: خط ۱:
[[پرونده:BLOSUM62.png|بندانگشتی|400px|ماتریس بلوسام۶۲.]]
[[پرونده:BLOSUM62.gif|بندانگشتی|400x400پیکسل|این BLOSUM62 ماتریس]]
ماتریس‌های '''بلوسام''' ('''BLOSUM''') ( ماتریس بلوک‌های جایگزینی) یک ماتریس جایگزینی است که در [[هم‌تراز کردن توالی|هم‌تراز کردن توالی‌های]] پروتئینی استفاده می‌شود. این ماتریس ها برای امتیازدهی هم ترازی های توالی های پروتئینی که در تکامل از یکدیگر متمایز شده اند، استفاده می شود و بر مبنای همترازی محلی میباشند. ماتریس بلوسام برای اولین بر در مقاله‌ای توسط Henikoff معرفی شد.<ref>{{یادکرد ژورنال|نویسنده=Henikoff, S.; Henikoff, J.G|عنوان=Amino Acid Substitution Matrices from Protein Blocks|ژورنال=PNAS|ناشر=|تاریخ=1992|زبان=|شاپا=|doi=10.1073/pnas.89.22.10915|پیوند=|تاریخ دسترسی=}}</ref>آنها پایگاه دادهٔ بلوک‌ها را برای پیدا کردن [[مناطق حفاظت شده]] در [[پروتئین‌ها]] پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانس‌های [[آمینو اسید|آمینو اسیدهای]] مرتبط و احتمال‌های جایگزینی را به دست آوردند.سپس امتیاز [[لوجیت]] هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند.بر خلاف ماتریس‌های PAM که بر پایه مقایسه بین پروتئین نزدیک [[برون‌یابی]] می‌شود، ماتریس‌های بلوسام بر پایهٔ هم ترازی‌های مشاهده‌شده ساخته شده‌است.
ماتریس‌های بلوسام (BLOSUM) ( ماتریس بلوک‌های جایگزینی) یک ماتریس جایگزینی است که در هم‌تراز کردن توالی‌های پروتئینی استفاده می‌شود. این ماتریس ها برای امتیازدهی هم ترازی های توالی های پروتئینی که در تکامل از یکدیگر متمایز شده اند، استفاده می شود و بر مبنای همترازی محلی میباشند. ماتریس بلوسام برای اولین بر در مقاله‌ای توسط Henikoff معرفی شد.<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> آنها پایگاه دادهٔ بلوک‌ها را برای پیدا کردن مناطق حفاظت شده در پروتئین‌ها پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانس‌های آمینو اسیدهای مرتبط و احتمال‌های جایگزینی را به دست آوردند.سپس امتیاز لوجیت هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند.بر خلاف ماتریس‌های PAM که بر پایه مقایسه بین پروتئین نزدیک برون‌یابی می‌شود، ماتریس‌های بلوسام بر پایهٔ هم ترازی‌های مشاهده‌شده ساخته شده‌است.


== پیشینه ی زیستی ==
== پس زمینه ی زیستی ==
دستورالعمل های [[ژنتیک|ژنتیکی]] هر سلول از یک موجود زنده در [[دی‌ان‌ای|DNA]] آن ذخیره شده است. در طول حیات سلول، این اطلاعات برای تولید پروتئین و یا برای [[تقسیم سلولی]] ر[[رونویسی (ژنتیک)|ونویس]]<nowiki/>ی می شوند و احتمال آن وجود دارد که این محتویات در حین این فرآیند ها دستخوش تغییر شوند. این تغییر به عنوان [[جهش]] شناخته شده است. در سطح مولکولی سیستم های تنظیم کننده ای هستند که بیشتر این جهش ها را اصلاح می کنند.
دستورالعمل های ژنتیکی هر سلول از یک موجود زنده در DNA آن ذخیره شده است. <ref name="campbell-ch16">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=307–325}}</ref> در طول حیات سلول، این اطلاعات برای تولید پروتئین و یا برای تقسیم سلولی رونویسی می شوند و احتمال آن وجود دارد که این محتویات در حین این فرآیند ها دستخوش تغییر شوند.<ref name="campbell-ch16">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=307–325}}</ref><ref name="campbell-ch17">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=327–350}}</ref> این تغییر به عنوان جهش شناخته شده است. در سطح مولکولی سیستم های تنظیم کننده ای هستند که بیشتر این جهش ها را اصلاح می کنند.<ref name="campbell-ch17">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=327–350}}</ref><ref name="pal">{{Cite book|title=Fundamentals of Molecular Biology|publisher=Oxford University Press|year=2009|isbn=9780195697810|edition=1st|pages=187–203}}</ref>

عملکرد پروتئین ها بسیار وابسته به ساختار آن ها است. تغییر یک [[اسید آمینه|آمینواسید]] در پروتئین ممکن است کارآمدی آن را برای انجام وظیفه ی مربوطه کاهش و یا کارکرد آن را تغییر دهد. تغییرات این چنینی می توانند یک عملکرد حیاتی در سلول را مختل کنند و یا حتی منجر به مرگ سلول شوند.


عملکرد پروتئین ها بسیار وابسته به ساختار آن ها است.<ref name="campbell-ch5">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=68–89}}</ref> تغییر یک آمینواسید در پروتئین ممکن است کارآمدی آن را برای انجام وظیفه ی مربوطه کاهش و یا کارکرد آن را تغییر دهد.<ref name="campbell-ch17">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=327–350}}</ref> تغییرات این چنینی می توانند یک عملکرد حیاتی در سلول را مختل کنند و یا حتی منجر به مرگ سلول شوند. <ref>{{Cite journal|url=http://www.nature.com/scitable/topicpage/mendelian-ratios-and-lethal-genes-557|title=Mendelian Ratios and Lethal Genes|last=Lobo|first=Ingrid|publisher=[[Nature Publishing Group]]|accessdate=19 October 2013|year=2008}}</ref> 
در مقابل، این تغییر ممکن است به سلول اجازه ادامه ی فعالیت هرچند متفاوت را بدهدو جهش به فرزندان موجودات زنده منتقل شود. اگر این تغییر باعث ضعف جسمی قابل توجهی نشود این احتمال وجود دارد که جهش در جمعیت باقی بماند. همچنین این امکان وجود دارد که تغییر در عملکرد یک تغییر مفید باشد.
در مقابل، این تغییر ممکن است به سلول اجازه ادامه ی فعالیت هرچند متفاوت را بدهدو جهش به فرزندان موجودات زنده منتقل شود. اگر این تغییر باعث ضعف جسمی قابل توجهی نشود این احتمال وجود دارد که جهش در جمعیت باقی بماند. همچنین این امکان وجود دارد که تغییر در عملکرد یک تغییر مفید باشد.


20 اسید آمینه ترجمه شده توسط [[رمز ژنتیکی|کد ژنتیکی]] تا حدود زیادی از نظر خواص فیزیکی و شیمیایی زنجیره های جانبی آنها متفاوت هستند. [5] با این حال، اسیدهای آمینه را می توان در گروههای با خواس فیزیکوشیمیایی مشابه دسته بندی کرد. [5] جایگزینی یک اسید آمینه با یکی دیگر از آمینواسیدهای هم گروه احتمال بیشتری دارد که تاثیر کمتری بر روی ساختار و عملکرد یک پروتئین داشته باشد تا این که با اسید آمینه های دسته ی های دیگر جایگزین شود.
20 اسید آمینه ترجمه شده توسط کد ژنتیکی تا حدود زیادی از نظر خواص فیزیکی و شیمیایی زنجیره های جانبی آنها متفاوت هستند.<ref name="campbell-ch5">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=68–89}}</ref> این اسیدهای آمینه می تواند به طبقه بندی به گروه های مشابه با خواص فيزيکوشيميايی.<ref name="campbell-ch5">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=68–89}}</ref> جایگزین کردن یک اسید آمینه با یکی دیگر از همان دسته است بیشتر احتمال دارد به یک کوچکتر تاثیر بر ساختار و عملکرد پروتئین از جایگزینی با یک اسید آمینه از رده های مختلف.


همترازی توالی ها یک روش اساسی برای تحقیقات زیست شناسی مدرن است. رایج ترین همردیفی توالی های پروتئین، جستجوی شباهت بین توالی های مختلف به منظور فهم تفاوت تکاملی توالی های پروتئینی به منظور پیش بینی وظیفه ی ژن های جهش یافته است. ماتریس ها در اگوریتم های محاسبه ی میزان شباهت توالی ها استفاده می شوند.
همترازی توالی ها یک روش اساسی برای تحقیقات زیست شناسی مدرن است. رایج ترین همردیفی توالی های پروتئین، جستجوی شباهت بین توالی های مختلف به منظور فهم تفاوت تکاملی توالی های پروتئینی به منظور پیش بینی وظیفه ی ژن های جهش یافته است. ماتریس ها در اگوریتم های محاسبه ی میزان شباهت توالی ها استفاده می شوند.
ماتریس به عنوان الگوریتم برای محاسبه شباهت توالی های مختلف از پروتئین استفاده شود. با این حال، ابزار Dayhoff ماتریس که یک روش به طور گسترده استفاده محدود است به علت قبل از نیاز به توالی با شباهت بیش از 85٪ است. به منظور پر کردن شکاف در ESTA، Henikoff و Henikoff معرفی بلوسام (بلوک تعویض ماتریکس) ماتریس که به اصلاحاتی را در صف و در جستجو با استفاده از نمایش داده شد از هر یک از گروه پروتئین مرتبط منجر شده است. 
<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref>


== اصطلاحات ==
ماتریس به عنوان الگوریتم برای محاسبه شباهت توالی های مختلف از پروتئین استفاده شود. با این حال، ابزار Dayhoff ماتریس که یک روش به طور گسترده استفاده محدود است به علت قبل از نیاز به توالی با شباهت بیش از 85٪ است. به منظور پر کردن شکاف در ESTA، Henikoff و Henikoff معرفی بلوسام (بلوک تعویض ماتریکس) ماتریس که به اصلاحاتی را در صف و در جستجو با استفاده از نمایش داده شد از هر یک از گروه پروتئین مرتبط منجر شده است. [1]
بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود.


بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود.
== واژگان ==

بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود.
ماتریس های امتیازدهی (آمار در مقابل زیست شناسی) : برای معنا یافتن ارزیابی هم ترازی توالی ها نیاز به ماتریس امتیازدهی و یا جدولی است که بیانگر احتمال جایگزینی معنادار جفت آمینواسید ها و یا جفت نوکلئوتیدها در یک همتراری است. امتیاز ها برای هر موقعیت مکانی از همترازی محلی پروتئین ها بدست می آیند.<ref name="pertsemlidis">{{Cite journal|title=Having a BLAST with bioinformatics (and avoiding BLASTphemy)|last=pertsemlidis A.|last2=Fondon JW.3rd|date=September 2001|journal=genome biology|issue=10|volume=2|pages=reviews2002.1-2002.10|pmid=11597340}}</ref>


ماتریس های امتیازدهی (آمار در مقابل زیست شناسی) : برای معنا یافتن ارزیابی هم ترازی توالی ها نیاز به ماتریس امتیازدهی و یا جدولی است که بیانگر احتمال جایگزینی معنادار جفت آمینواسید ها و یا جفت نوکلئوتیدها در یک همتراری است. امتیاز ها برای هر موقعیت مکانی از همترازی محلی پروتئین ها بدست می آیند.


دسته های متعددی از ماتریس های بلوسام با استفاده از پایگاه های داده وابسته به هم ترازی های متفاوت وجود دارند که با عددهای متفاوت نامگذاری می شوند.
دسته های متعددی از ماتریس های بلوسام با استفاده از پایگاه های داده وابسته به هم ترازی های متفاوت وجود دارند که با عددهای متفاوت نامگذاری می شوند.
ماتریس های بلوسام با اعداد بزرگتر برای مقایسه ی توالی های نزدیک به هم طراحی شده اند در حالیکه ماتریس هایی با اعداد کوچکتر این عمل را برای توالی های نسبتا دور انجام می دهند. به عنوان مثال BLOSUM80 برای هم ترازی توالی هایی با تفاوت کمتر و BLOSUM45 برای هم تراری توالی های متفاوت تر استفاده می شود 


ماتریس‌ها توسط ادغام کردن همهٔ دنباله‌هایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنباله‌ها را مقایسه میکند.درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنباله‌هایی با یکسانی بیش از ۸۰ درصد تولید می‌شود.<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref>
ماتریس های بلوسام با اعداد بزرگتر برای مقایسه ی توالی های نزدیک به هم طراحی شده اند در حالیکه ماتریس هایی با اعداد کوچکتر این عمل را برای توالی های نسبتا دور انجام می دهند. به عنوان مثال BLOSUM80 برای هم ترازی توالی هایی با تفاوت کمتر و BLOSUM45 برای هم تراری توالی های متفاوت تر استفاده می شود

ماتریس‌ها توسط ادغام کردن همهٔ دنباله‌هایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنباله‌ها را مقایسه میکند.درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنباله‌هایی با یکسانی بیش از ۸۰ درصد تولید می‌شود.


== ساخت ماتریس های بلوسام ==
== ساخت ماتریس های بلوسام ==
ماتریس های بلوسام با استفاده از اعمال روش های آماری بر بلوک های آمینواسیدهای مشابه برای بدست آوردن امتیازهای شباهت بدست می آیند.
ماتریس های بلوسام با استفاده از اعمال روش های آماری بر بلوک های آمینواسیدهای مشابه برای بدست آوردن امتیازهای شباهت بدست می آیند.
مراحل روش های آماری:  <ref>{{Cite web|url=http://web.utm.my/aibig/images/saberi/Bioinformatics/blosum_matrices_slides_final.pdf|title=BLOSSUM MATRICES: Introduction to BIOINFORMATICS|accessdate=9 September 2014|website=UNIVERSITI TEKNOLOGI MALAYSIA|year=2009}}</ref>


=== حذف توالی ===
مراحل روش های آماری:

=== حذف توالی ها ===
حذف توالی های با میزان شباهت بیشتر از r%.
حذف توالی های با میزان شباهت بیشتر از r%.
دو روش برای حذف توالی ها وجود دارد. یا می توان توالی ها را از بلوک مربوطه حذف کرد و یا توالی های مشابه را یافته و با توالی های جدیدی که می توانید نماینده ی خوشه های مربوطه باشند جایگزین نمود. این عمل برای جلوگیری از بایاس نتیجه به نفع پروتئین های مشابه صورت می گیرد. 


=== محاسبه فرکانس و احتمال ===
دو روش برای حذف توالی ها وجود دارد. یا می توان توالی ها را از بلوک مربوطه حذف کرد و یا توالی های مشابه را یافته و با توالی های جدیدی که می توانید نماینده ی خوشه های مربوطه باشند جایگزین نمود. این عمل برای جلوگیری از بایاس نتیجه به نفع پروتئین های مشابه صورت می گیرد.

=== محاسبه ی فرکانس و احتمال ===
پایگاه داده ای برای ذخیره سازی هم ترازی توالی هایی از نواحی با بیشترین حفاظت از خانواده ی پروتئین ها. این هم ترازی ها برای بدست آوردن ماتریس بلوسام استفاده می شوند.نواحی حفاظت شده ، نواحی ای از آمینواسید ها هستند که تغییر جزئی بین آن ها وجود دارد.
پایگاه داده ای برای ذخیره سازی هم ترازی توالی هایی از نواحی با بیشترین حفاظت از خانواده ی پروتئین ها. این هم ترازی ها برای بدست آوردن ماتریس بلوسام استفاده می شوند.نواحی حفاظت شده ، نواحی ای از آمینواسید ها هستند که تغییر جزئی بین آن ها وجود دارد.


خط ۴۲: خط ۴۱:
از رابطه ی زیر بدست می آید.
از رابطه ی زیر بدست می آید.


<math />
<math>LogOddRatio = 2log_2( P(O)/P(E) ) </math>


که <math>P(O)</math> احتمال مشاهده شده و <math>P(E)</math> احتمال مورد انتظار است.
که در آن <math /> احتمال  مشاهده شده و <math /> احتمال مورد انتظار است.


=== ماتریس های بلوسام ===
=== BLOSUM ماتریس ===
میزای شانس شباهت توسط نرخ Log Odd محاسبه شده و ماتریس های بلوسام از گرد کردن این مقادیر بدست می آیند.
میزای شانس شباهت توسط نرخ Log Odd محاسبه شده و ماتریس های بلوسام از گرد کردن این مقادیر بدست می آیند.


=== امتیاز ماتریس های بلوسام ===
=== امتیاز ماتریس های بلوسام ===
یک ماتریس امتیازدهی و یا جدولی از مقادیر برای ارزیابی اهمیت هم ترازی توالی ها مورد نیاز است. به طور کلی وقتی دو توالی نوکلئوتیدی مقایسه می شوندتمامی آن چه در امتیازدهی در نظرگرفته می شود آن است که دو باز در مکان های متناظر یکسان هستند یا نه. تمامی برابری ها و عدم برابری ها امتیاز یکسانی دارند. ولی این قضیه در رابطه با پروتئین ها متفاوت است و ماتریس های جایگزینی برای آمینواسیدها پیچیده تر هستند و تمامی عواملی که ممکن است فرکانس جایگزینی را تغییر دهد در نظر گرفته می شوند که در نتیجه ی آن پنالتی نسبتا زیاد برای همترازی هایی است که احتمال همولوگ بودن آن ها پایین است. جایگزینی ها با فرکانس های متفاوتی رخ می دهند و این سبب به هم ریختن یکنواختی نرخ حایگزینی می شود.
یک ماتریس امتیازدهی و یا جدولی از مقادیر برای ارزیابی اهمیت هم ترازی توالی ها مورد نیاز است. به طور کلی وقتی دو توالی نوکلئوتیدی مقایسه می شوندتمامی آن چه در امتیازدهی در نظرگرفته می شود آن است که دو باز در مکان های متناظر یکسان هستند یا نه. تمامی برابری ها و عدم برابری ها امتیاز یکسانی دارند.<ref>{{Cite web|url=http://www.cs.uic.edu/~msivaram/Bio_Tools.PDF|title=CS#594 - Group 13 (Tools and softwares)|accessdate=9 September 2014|website=University of Illinois at Chicago - UIC|last=Murali Sivaramakrishnan|last2=Ognjen Perisic|last3=Shashi Ranjan}}</ref> ولی این قضیه در رابطه با پروتئین ها متفاوت است و ماتریس های جایگزینی برای آمینواسیدها پیچیده تر هستند و تمامی عواملی که ممکن است فرکانس جایگزینی را تغییر دهد در نظر گرفته می شوند که در نتیجه ی آن پنالتی نسبتا زیاد برای همترازی هایی است که احتمال همولوگ بودن آن ها پایین است.<ref name="pertsemlidis">{{Cite journal|title=Having a BLAST with bioinformatics (and avoiding BLASTphemy)|last=pertsemlidis A.|last2=Fondon JW.3rd|date=September 2001|journal=genome biology|issue=10|volume=2|pages=reviews2002.1-2002.10|pmid=11597340}}</ref>


ماتریس های جایگزینی ای که به صورت عمده استفاده می شوند ماتریس های بلوسام (BLOSUM) و ماتریس های جهش نقطه ای پذیرفته شده (PAM) هستند. این دو ماتریس با روش های متفاوتی محاسبه می شوند.
ماتریس های جایگزینی ای که به صورت عمده استفاده می شوند ماتریس های بلوسام (BLOSUM) <ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> و ماتریس های جهش نقطه ای پذیرفته شده (PAM) <ref name="dayhoff">{{Cite book|title=Atlas of Protein Sequence and Structure|last=Margaret O.|first=Dayhoff|date=1978|publisher=National Biomedical Research Foundation|volume=5|location=Washington DC|pages=345–352|chapter=22}}</ref><ref name="States">{{Cite journal|title=Improved sensitivity of nucleic acid database searches using application-specific scoring matrices.|last=States DJ.|last2=Gish W.|journal=Methods: A Companion to Methods in Enzymology|doi=10.1016/s1046-2023(05)80165-3|year=1991|volume=3|pages=66–70|issn=1046-2023|last3=Altschul SF.}}</ref>  هستند.این دو ماتریس با روش های متفاوتی محاسبه می شوند.<ref name="pertsemlidis">{{Cite journal|title=Having a BLAST with bioinformatics (and avoiding BLASTphemy)|last=pertsemlidis A.|last2=Fondon JW.3rd|date=September 2001|journal=genome biology|issue=10|volume=2|pages=reviews2002.1-2002.10|pmid=11597340}}</ref>

امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت درست‌نمایی دو آمینو اسید که بیولوژیکی ظاهر شده‌اند به درست‌نمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شده‌اند، محاسبه میشود.مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه می‌دهد.<ref name="handbook">{{Cite book|url=https://books.google.com/books?id=kDFltuQo1dMC&pg=PA673&lpg=PA673&dq=blosum+matrix|title=Handbook of Nature-Inspired And Innovative Computing|last=Albert Y. Zomaya|publisher=Springer|year=2006|isbn=0-387-40532-1|location=New York, NY}}</ref> <ref>[http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Scoring2.html NIH "Scoring Systems"]</ref> 

تساوی زیر برای محاسبه ماتریس BLOSUM استفاده می‌شود:
: <math />
در اینجا <math /> احتمال جابجا شدن دو آمینو اسید <math /> و <math /> در دنباله‌های مشابه (آنالوگ) و <math /> و <math /> احتمال رخ دادن آمینو اسید <math /> و <math /> به صورت تصادفی در دنباله پروتیین‌ها میباشد.به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور <math /> استفاده میکنیم.

== مثال - BLOSUM62 ==


امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت [[درست‌نمایی]] دو [[آمینو اسید]] که بیولوژیکی ظاهر شده‌اند به درست‌نمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شده‌اند، محاسبه میشود.مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه می‌دهد.


تساوی زیر برای محاسبه ماتریس BLOSUM استفاده می‌شود:
:<math>S_{ij}= \left(\frac{1}{\lambda} \right)\log{\left(\frac{p_{ij}}{q_i * q_j} \right)}</math>


در اینجا <math>p_{ij}</math> احتمال جابجا شدن دو آمینو اسید <math>i</math> و <math>j</math> در دنباله‌های مشابه (آنالوگ) و <math>q_i</math> و <math>q_j</math> احتمال رخ دادن آمینو اسید <math>i</math> و <math>j</math> به صورت تصادفی در دنباله پروتیین‌ها میباشد.به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور <math>\lambda</math> استفاده میکنیم.


== نمونه های بلوسام ==
بلوسام62: پروتئین های با ارتباط متوسط
بلوسام62: پروتئین های با ارتباط متوسط



بلوسام80: پروتئین های مرتبط تر
بلوسام80: پروتئین های مرتبط تر
بلوسام


بلوسام45: پروتئین های با ارتباط کمتر
45: پروتئین های با ارتباط کمتر 


مقاله‌ای در Nature Biotechnology نشان داد کهBLOSUM۶۲ که سالیان سال است به عنوان استاندارد استفاده می‌شود طبق الگوریتمی که هنیکوف ارائه داده دقیقاً صحیح نیست.در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا می‌دهد.
مقاله‌ای در Nature Biotechnology  <ref name="article">{{Cite journal|url=http://www.nature.com/nbt/journal/v26/n3/full/nbt0308-274.html|title=BLOSUM62 miscalculations improve search performance|last=Mark P Styczynski|last2=Kyle L Jensen|journal=Nat. Biotechnol.|issue=3|doi=10.1038/nbt0308-274|year=2008|volume=26|pages=274–275|pmid=18327232|last3=Isidore Rigoutsos|last4=Gregory Stephanopoulos}}</ref> نشان داد کهBLOSUM۶۲ که سالیان سال است به عنوان استاندارد استفاده می‌شود طبق الگوریتمی که هنیکوف ارائه داده دقیقاً صحیح نیست.<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا می‌دهد. <ref name="article">{{Cite journal|url=http://www.nature.com/nbt/journal/v26/n3/full/nbt0308-274.html|title=BLOSUM62 miscalculations improve search performance|last=Mark P Styczynski|last2=Kyle L Jensen|journal=Nat. Biotechnol.|issue=3|doi=10.1038/nbt0308-274|year=2008|volume=26|pages=274–275|pmid=18327232|last3=Isidore Rigoutsos|last4=Gregory Stephanopoulos}}</ref>



== برخی از کاربردهای ماتریس بلوسام در بیوانفورماتیک ==

=== کاربردهای پژوهشی ===
امتیاز های بلوسام در پیش بینی و درک انواع ژن سطحی در میان حامل های ویروس هپاتیت B حامل<ref name="Roque-Afonso">{{Cite journal|title=Viral and clinical factors associated with surface gene variants among hepatitis B virus carriers.|journal=Antivir Ther|issue=8|year=2007|volume=12|pages=1255–1263|pmid=18240865}}</ref> و اپی توپ های لنفوسیت تی مورد استفاده قرار گرفته است <ref name="Nielsen">{{Cite journal|url=http://tools.immuneepitope.org/analyze/pdf/nielsen_2003_protein_sci.pdf|title=Reliable prediction of T‐cell epitopes using neural networks with novel sequence representations|journal=Protein Science|issue=5|doi=10.1110/ps.0239403|year=2003|volume=12|pages=1007–1017|display-authors=etal}}</ref>



=== استفاده در BLAST ===
BLOSUM ماتریس های بلوسام هم چنین به عنوان ماتریس امتیاز دهی در مقایسه ی توالی های DNA و توالی های پروتئین برای ارزیابی کیفیت هم ترازی استفاده می شود . این شکل سیستم امتیازدهی مجهز به نرم افزارهای گسترده ای من جمله BLAST است. <ref>{{Cite web|url=http://www.ncbi.nlm.nih.gov/BLAST/tutorial/Altschul-1.html#head9|title=The Statistics of Sequence Similarity Scores|accessdate=20 October 2013|website=National Centre for Biotechnology Information}}</ref>

==== مقایسه PAM و BLOSUM ====
علاوه بر ماتریس های BLOSUM ماتریسهای قبلا توسعه یافته  [[جهش پذیرفته نقطه‌ای|PAM]] می توانند استفاده شوند.<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref>

از آنجا که هر دو ماتریس PAM و BLOSUM روش های متفاوتی برای نمایش اطلاعات امتیازدهی یکسان هستند می توان این دو را مقایسه نمود اما به دلیل تفاوت زیاد روش بدست آوردن این اطلاعات BLOSUM100 با PAM100 یکی نیست.<ref>{{Cite web|url=http://www.birec.org/sandbox/omamasaudtutorial|title=PAM and BLOSSUM SUBSITUTION MATRICES|accessdate=20 October 2013|website=Birec|last=Saud|first=Omama|year=2009}}</ref>
{| class="wikitable" style="margin: 1em auto 10px; text-align: center; width: 30%;"
! PAM
! BLOSUM
|-
| PAM100
| BLOSUM90
|-
| PAM120
| BLOSUM80
|-
| PAM160
| BLOSUM60
|-
| PAM200
| BLOSUM52
|-
| PAM250
| BLOSUM45
|}


== مقایسه ی PAM و BLOSUM ==
===== رابطه بین PAM و BLOSUM =====
{| class="wikitable"
{| class="wikitable" style="margin: 1em auto 10px; text-align: center; width: 90%;"
! PAM
|+ارتباط PAM و BLOSUM
!BLOSUM
! BLOSUM
!PAM
|-
|-
|برای مقایسه ی توالی های بسیار مرتبط،
| برای مقایسه ی توالی های بسیار مرتبط،
ماتریس های PAM با اعداد بزرگتر استفاده می شوند
|برای مقایسه ی توالی های بسیار مرتبط،
ماتریس های PAM با اعداد کمتر استفاده می شوند
ماتریس های PAM با اعداد کمتر استفاده می شوند
| برای مقایسه ی توالی های بسیار مرتبط،
ماتریس های BLOSUM با اعداد بزرگتر استفاده می شوند
|-
|-
|برای مقایسه ی توالی های با ارتباط کمتر
| برای مقایسه ی توالی های با ارتباط کمتر
ماتریس های PAM با اعداد کوچکتر استفاده می شوند
|برای مقایسه ی توالی های با ارتباط کمتر
ماتریس های PAM با اعدادبزرگتر استفاده می شوند
ماتریس های PAM با اعدادبزرگتر استفاده می شوند
| برای مقایسه ی توالی های با ارتباط کمتر
ماتریس های PAM با اعداد کوچکتر استفاده می شوند
|}
|}

{| class="wikitable"
|+تفاوت های ماتریس PAM و ماتریس BLOSUM
===== تفاوت بین PAM و BLOSUM =====
{| class="wikitable" style="margin: 1em auto 82px; text-align: center; width: 90%;"
!BLOSUM
!PAM
! PAM
! BLOSUM
|-
|-
|بر مبنای هم ترازی محلی است
|بر مبنای هم ترازی گلوبال
توالی های نزدیک هم است 
|بر مبنای هم ترازی [[جهانی‌گرایی|گلوبال]]
توالی های نزدیک هم است
|بر مبنای هم ترازی محلی است
|-
|-
|BLOSUM62 ماتریسی است که از مقایسه ی توالی هایی بدست می آید
که کمتر از 62% به هم شبیه هستند
|PAM1 ماتریسی است که از مقایسه ی توالی هایی
|PAM1 ماتریسی است که از مقایسه ی توالی هایی
بدست می آید که کمتر از 1% اختلاف دارند.
بدست می آید که کمتر از 1% اختلاف دارند. 
|BLOSUM62 ماتریسی است که از مقایسه ی توالی هایی بدست می آید
که کمتر از 62% به هم شبیه هستند 
|-
|-
|بر مبنای هم ترازی های مشاهده شده است
و از توالی های پروتئین نزدیک برون یابی نشده است.
|سایر ماتریس های PAM از برون یابی ماتریس PAM1 بدست آمده اند.
|سایر ماتریس های PAM از برون یابی ماتریس PAM1 بدست آمده اند.
|بر مبنای هم ترازی های مشاهده شده است
و از توالی های پروتئین نزدیک برون یابی نشده است. 
|-
|-
|عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر فاصله ی تکاملی بیشتر است.
|عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر
|عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر
میزان شباهت بیشتر در توالی ها و در نتیجه فاصله ی تکاملی کمتر است.
میزان شباهت بیشتر در توالی ها و در نتیجه فاصله ی تکاملی کمتر است.
<ref>{{Cite web|url=http://www.ctu.edu.vn/~dvxe/Bioinformatic%20course/mod4/mod4_0.html|title=The art of aligning protein sequences Part 1 Matrices|accessdate=7 September 2014|website=Dai hoc Can Tho - Can Tho University}}</ref>
|عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر فاصله ی تکاملی بیشتر است.
|}
|}


== جستارهای وابسته ==
== جستارهای وابسته ==
* [[هم‌ترازسازی توالی|دنباله تراز]]
* [[هم‌تراز کردن توالی]]
* [[نقطه پذیرفته‌شده جهش]]
* [[جهش پذیرفته نقطه‌ای|نقطه پذیرفته جهش]]


== منابع ==
== منابع ==
{{reflist|2}}


== پیوند به بیرون ==
== لینک های خارجی ==
* {{Cite journal|title=Where did the BLOSUM62 alignment score matrix come from?|last=Sean R. Eddy|journal=Nature Biotechnology|issue=8|doi=10.1038/nbt0804-1035|year=2004|volume=22|pages=1035–6|pmid=15286655}}
* BLOSUM. (۲۰۱۱، April ۷). In Wikipedia، The Free Encyclopedia. Retrieved ۱۸:۴۸، June ۲۶، ۲۰۱۱، from http://en.wikipedia.org/w/index.php?title=BLOSUM&oldid=422872426
* [http://helix.biology.mcmaster.ca/721/distance/node10.html Page on BLOSUM]
* [http://blocks.fhcrc.org/ بلوک WWW سرور]
* [http://www.ncbi.nlm.nih.gov/BLAST/tutorial/Altschul-1.html سیستم امتیاز دهی برای انفجار در NCBI]
* {{cite journal |journal=Nature Biotechnology | title=Where did the BLOSUM62 alignment score matrix come from? | author=Sean R. Eddy | doi=10.1038/nbt0804-1035 | pmid=15286655 | year=2004 | volume=22 | pages=1035 | issue=8}}
* [ftp://ftp.ncbi.nih.gov/blast/matrices/ فایل های داده از BLOSUM در NCBI سرور FTP].
* [http://blocks.fhcrc.org/ BLOCKS WWW server]
* [http://ahmetrasit.com/blosum/ تعاملی BLOSUM شبکه تجسم]
* [http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Scoring2.html Scoring systems for BLAST at NCBI]
[[رده:روش‌های بیوشیمی]]
* [ftp://ftp.ncbi.nih.gov/blast/matrices/ Data files of BLOSUM on the NCBI FTP server].

[[رده:بیوانفورماتیک]]
[[رده:بیوانفورماتیک]]
[[رده:روش‌های بیوشیمی]]
[[رده:فیلوژنتیک رایانشی]]
[[رده:ژنتیک]]
[[رده:ژنتیک]]
[[رده:فیلوژنتیک رایانشی]]
[[رده:ماتریس‌ها]]
[[رده:ماتریس‌ها]]

نسخهٔ ‏۳۰ دسامبر ۲۰۱۶، ساعت ۱۶:۴۳

این BLOSUM62 ماتریس

ماتریس‌های بلوسام (BLOSUM) ( ماتریس بلوک‌های جایگزینی) یک ماتریس جایگزینی است که در هم‌تراز کردن توالی‌های پروتئینی استفاده می‌شود. این ماتریس ها برای امتیازدهی هم ترازی های توالی های پروتئینی که در تکامل از یکدیگر متمایز شده اند، استفاده می شود و بر مبنای همترازی محلی میباشند. ماتریس بلوسام برای اولین بر در مقاله‌ای توسط Henikoff معرفی شد.[۱] آنها پایگاه دادهٔ بلوک‌ها را برای پیدا کردن مناطق حفاظت شده در پروتئین‌ها پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانس‌های آمینو اسیدهای مرتبط و احتمال‌های جایگزینی را به دست آوردند.سپس امتیاز لوجیت هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند.بر خلاف ماتریس‌های PAM که بر پایه مقایسه بین پروتئین نزدیک برون‌یابی می‌شود، ماتریس‌های بلوسام بر پایهٔ هم ترازی‌های مشاهده‌شده ساخته شده‌است.

پس زمینه ی زیستی

دستورالعمل های ژنتیکی هر سلول از یک موجود زنده در DNA آن ذخیره شده است. [۲] در طول حیات سلول، این اطلاعات برای تولید پروتئین و یا برای تقسیم سلولی رونویسی می شوند و احتمال آن وجود دارد که این محتویات در حین این فرآیند ها دستخوش تغییر شوند.[۲][۳] این تغییر به عنوان جهش شناخته شده است. در سطح مولکولی سیستم های تنظیم کننده ای هستند که بیشتر این جهش ها را اصلاح می کنند.[۳][۴]

عملکرد پروتئین ها بسیار وابسته به ساختار آن ها است.[۵] تغییر یک آمینواسید در پروتئین ممکن است کارآمدی آن را برای انجام وظیفه ی مربوطه کاهش و یا کارکرد آن را تغییر دهد.[۳] تغییرات این چنینی می توانند یک عملکرد حیاتی در سلول را مختل کنند و یا حتی منجر به مرگ سلول شوند. [۶]  در مقابل، این تغییر ممکن است به سلول اجازه ادامه ی فعالیت هرچند متفاوت را بدهدو جهش به فرزندان موجودات زنده منتقل شود. اگر این تغییر باعث ضعف جسمی قابل توجهی نشود این احتمال وجود دارد که جهش در جمعیت باقی بماند. همچنین این امکان وجود دارد که تغییر در عملکرد یک تغییر مفید باشد.

20 اسید آمینه ترجمه شده توسط کد ژنتیکی تا حدود زیادی از نظر خواص فیزیکی و شیمیایی زنجیره های جانبی آنها متفاوت هستند.[۵] این اسیدهای آمینه می تواند به طبقه بندی به گروه های مشابه با خواص فيزيکوشيميايی.[۵] جایگزین کردن یک اسید آمینه با یکی دیگر از همان دسته است بیشتر احتمال دارد به یک کوچکتر تاثیر بر ساختار و عملکرد پروتئین از جایگزینی با یک اسید آمینه از رده های مختلف.

همترازی توالی ها یک روش اساسی برای تحقیقات زیست شناسی مدرن است. رایج ترین همردیفی توالی های پروتئین، جستجوی شباهت بین توالی های مختلف به منظور فهم تفاوت تکاملی توالی های پروتئینی به منظور پیش بینی وظیفه ی ژن های جهش یافته است. ماتریس ها در اگوریتم های محاسبه ی میزان شباهت توالی ها استفاده می شوند. ماتریس به عنوان الگوریتم برای محاسبه شباهت توالی های مختلف از پروتئین استفاده شود. با این حال، ابزار Dayhoff ماتریس که یک روش به طور گسترده استفاده محدود است به علت قبل از نیاز به توالی با شباهت بیش از 85٪ است. به منظور پر کردن شکاف در ESTA، Henikoff و Henikoff معرفی بلوسام (بلوک تعویض ماتریکس) ماتریس که به اصلاحاتی را در صف و در جستجو با استفاده از نمایش داده شد از هر یک از گروه پروتئین مرتبط منجر شده است.  [۱]

اصطلاحات

بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود.

بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود.

ماتریس های امتیازدهی (آمار در مقابل زیست شناسی) : برای معنا یافتن ارزیابی هم ترازی توالی ها نیاز به ماتریس امتیازدهی و یا جدولی است که بیانگر احتمال جایگزینی معنادار جفت آمینواسید ها و یا جفت نوکلئوتیدها در یک همتراری است. امتیاز ها برای هر موقعیت مکانی از همترازی محلی پروتئین ها بدست می آیند.[۷]


دسته های متعددی از ماتریس های بلوسام با استفاده از پایگاه های داده وابسته به هم ترازی های متفاوت وجود دارند که با عددهای متفاوت نامگذاری می شوند. ماتریس های بلوسام با اعداد بزرگتر برای مقایسه ی توالی های نزدیک به هم طراحی شده اند در حالیکه ماتریس هایی با اعداد کوچکتر این عمل را برای توالی های نسبتا دور انجام می دهند. به عنوان مثال BLOSUM80 برای هم ترازی توالی هایی با تفاوت کمتر و BLOSUM45 برای هم تراری توالی های متفاوت تر استفاده می شود 

ماتریس‌ها توسط ادغام کردن همهٔ دنباله‌هایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنباله‌ها را مقایسه میکند.درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنباله‌هایی با یکسانی بیش از ۸۰ درصد تولید می‌شود.[۱]

ساخت ماتریس های بلوسام

ماتریس های بلوسام با استفاده از اعمال روش های آماری بر بلوک های آمینواسیدهای مشابه برای بدست آوردن امتیازهای شباهت بدست می آیند. مراحل روش های آماری:  [۸]

حذف توالی

حذف توالی های با میزان شباهت بیشتر از r%. دو روش برای حذف توالی ها وجود دارد. یا می توان توالی ها را از بلوک مربوطه حذف کرد و یا توالی های مشابه را یافته و با توالی های جدیدی که می توانید نماینده ی خوشه های مربوطه باشند جایگزین نمود. این عمل برای جلوگیری از بایاس نتیجه به نفع پروتئین های مشابه صورت می گیرد. 

محاسبه فرکانس و احتمال

پایگاه داده ای برای ذخیره سازی هم ترازی توالی هایی از نواحی با بیشترین حفاظت از خانواده ی پروتئین ها. این هم ترازی ها برای بدست آوردن ماتریس بلوسام استفاده می شوند.نواحی حفاظت شده ، نواحی ای از آمینواسید ها هستند که تغییر جزئی بین آن ها وجود دارد.

نرخ Log Odd

از رابطه ی زیر بدست می آید.

که در آن احتمال  مشاهده شده و احتمال مورد انتظار است.

BLOSUM ماتریس

میزای شانس شباهت توسط نرخ Log Odd محاسبه شده و ماتریس های بلوسام از گرد کردن این مقادیر بدست می آیند.

امتیاز ماتریس های بلوسام

یک ماتریس امتیازدهی و یا جدولی از مقادیر برای ارزیابی اهمیت هم ترازی توالی ها مورد نیاز است. به طور کلی وقتی دو توالی نوکلئوتیدی مقایسه می شوندتمامی آن چه در امتیازدهی در نظرگرفته می شود آن است که دو باز در مکان های متناظر یکسان هستند یا نه. تمامی برابری ها و عدم برابری ها امتیاز یکسانی دارند.[۹] ولی این قضیه در رابطه با پروتئین ها متفاوت است و ماتریس های جایگزینی برای آمینواسیدها پیچیده تر هستند و تمامی عواملی که ممکن است فرکانس جایگزینی را تغییر دهد در نظر گرفته می شوند که در نتیجه ی آن پنالتی نسبتا زیاد برای همترازی هایی است که احتمال همولوگ بودن آن ها پایین است.[۷]

ماتریس های جایگزینی ای که به صورت عمده استفاده می شوند ماتریس های بلوسام (BLOSUM) [۱] و ماتریس های جهش نقطه ای پذیرفته شده (PAM) [۱۰][۱۱]  هستند.این دو ماتریس با روش های متفاوتی محاسبه می شوند.[۷]

امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت درست‌نمایی دو آمینو اسید که بیولوژیکی ظاهر شده‌اند به درست‌نمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شده‌اند، محاسبه میشود.مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه می‌دهد.[۱۲] [۱۳] 

تساوی زیر برای محاسبه ماتریس BLOSUM استفاده می‌شود:

در اینجا احتمال جابجا شدن دو آمینو اسید و در دنباله‌های مشابه (آنالوگ) و و احتمال رخ دادن آمینو اسید و  به صورت تصادفی در دنباله پروتیین‌ها میباشد.به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور  استفاده میکنیم.

مثال - BLOSUM62

بلوسام62: پروتئین های با ارتباط متوسط


بلوسام80: پروتئین های مرتبط تر بلوسام

45: پروتئین های با ارتباط کمتر 

مقاله‌ای در Nature Biotechnology  [۱۴] نشان داد کهBLOSUM۶۲ که سالیان سال است به عنوان استاندارد استفاده می‌شود طبق الگوریتمی که هنیکوف ارائه داده دقیقاً صحیح نیست.[۱] در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا می‌دهد. [۱۴]


برخی از کاربردهای ماتریس بلوسام در بیوانفورماتیک

کاربردهای پژوهشی

امتیاز های بلوسام در پیش بینی و درک انواع ژن سطحی در میان حامل های ویروس هپاتیت B حامل[۱۵] و اپی توپ های لنفوسیت تی مورد استفاده قرار گرفته است [۱۶]


استفاده در BLAST

BLOSUM ماتریس های بلوسام هم چنین به عنوان ماتریس امتیاز دهی در مقایسه ی توالی های DNA و توالی های پروتئین برای ارزیابی کیفیت هم ترازی استفاده می شود . این شکل سیستم امتیازدهی مجهز به نرم افزارهای گسترده ای من جمله BLAST است. [۱۷]

مقایسه PAM و BLOSUM 

علاوه بر ماتریس های BLOSUM ماتریسهای قبلا توسعه یافته  PAM می توانند استفاده شوند.[۱]

از آنجا که هر دو ماتریس PAM و BLOSUM روش های متفاوتی برای نمایش اطلاعات امتیازدهی یکسان هستند می توان این دو را مقایسه نمود اما به دلیل تفاوت زیاد روش بدست آوردن این اطلاعات BLOSUM100 با PAM100 یکی نیست.[۱۸]

PAM BLOSUM
PAM100 BLOSUM90
PAM120 BLOSUM80
PAM160 BLOSUM60
PAM200 BLOSUM52
PAM250 BLOSUM45
رابطه بین PAM و BLOSUM
PAM BLOSUM
برای مقایسه ی توالی های بسیار مرتبط،

ماتریس های PAM با اعداد کمتر استفاده می شوند

برای مقایسه ی توالی های بسیار مرتبط،

ماتریس های BLOSUM با اعداد بزرگتر استفاده می شوند

برای مقایسه ی توالی های با ارتباط کمتر

ماتریس های PAM با اعدادبزرگتر استفاده می شوند

برای مقایسه ی توالی های با ارتباط کمتر

ماتریس های PAM با اعداد کوچکتر استفاده می شوند

تفاوت بین PAM و BLOSUM
PAM BLOSUM
بر مبنای هم ترازی گلوبال

توالی های نزدیک هم است 

بر مبنای هم ترازی محلی است
PAM1 ماتریسی است که از مقایسه ی توالی هایی

بدست می آید که کمتر از 1% اختلاف دارند. 

BLOSUM62 ماتریسی است که از مقایسه ی توالی هایی بدست می آید

که کمتر از 62% به هم شبیه هستند 

سایر ماتریس های PAM از برون یابی ماتریس PAM1 بدست آمده اند. بر مبنای هم ترازی های مشاهده شده است

و از توالی های پروتئین نزدیک برون یابی نشده است. 

عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر فاصله ی تکاملی بیشتر است. عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر

میزان شباهت بیشتر در توالی ها و در نتیجه فاصله ی تکاملی کمتر است. [۱۹]

جستارهای وابسته

منابع

  1. ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ ۱٫۴ ۱٫۵ Henikoff, S.; Henikoff, J.G. (1992). "Amino Acid Substitution Matrices from Protein Blocks". PNAS. 89 (22): 10915–10919. doi:10.1073/pnas.89.22.10915. PMC 50453. PMID 1438297.
  2. ۲٫۰ ۲٫۱ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. pp. 307–325. ISBN 9781442502215.
  3. ۳٫۰ ۳٫۱ ۳٫۲ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. pp. 327–350. ISBN 9781442502215.
  4. Fundamentals of Molecular Biology (1st ed.). Oxford University Press. 2009. pp. 187–203. ISBN 9780195697810.
  5. ۵٫۰ ۵٫۱ ۵٫۲ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. pp. 68–89. ISBN 9781442502215.
  6. Lobo, Ingrid (2008). "Mendelian Ratios and Lethal Genes". Nature Publishing Group. Retrieved 19 October 2013. {{cite journal}}: Cite journal requires |journal= (help)
  7. ۷٫۰ ۷٫۱ ۷٫۲ pertsemlidis A.; Fondon JW.3rd (September 2001). "Having a BLAST with bioinformatics (and avoiding BLASTphemy)". genome biology. 2 (10): reviews2002.1-2002.10. PMID 11597340.
  8. "BLOSSUM MATRICES: Introduction to BIOINFORMATICS" (PDF). UNIVERSITI TEKNOLOGI MALAYSIA. 2009. Retrieved 9 September 2014.
  9. Murali Sivaramakrishnan; Ognjen Perisic; Shashi Ranjan. "CS#594 - Group 13 (Tools and softwares)" (PDF). University of Illinois at Chicago - UIC. Retrieved 9 September 2014.
  10. Margaret O., Dayhoff (1978). "22". Atlas of Protein Sequence and Structure. Vol. 5. Washington DC: National Biomedical Research Foundation. pp. 345–352.
  11. States DJ.; Gish W.; Altschul SF. (1991). "Improved sensitivity of nucleic acid database searches using application-specific scoring matrices". Methods: A Companion to Methods in Enzymology. 3: 66–70. doi:10.1016/s1046-2023(05)80165-3. ISSN 1046-2023.
  12. Albert Y. Zomaya (2006). Handbook of Nature-Inspired And Innovative Computing. New York, NY: Springer. ISBN 0-387-40532-1.
  13. NIH "Scoring Systems"
  14. ۱۴٫۰ ۱۴٫۱ Mark P Styczynski; Kyle L Jensen; Isidore Rigoutsos; Gregory Stephanopoulos (2008). "BLOSUM62 miscalculations improve search performance". Nat. Biotechnol. 26 (3): 274–275. doi:10.1038/nbt0308-274. PMID 18327232.
  15. "Viral and clinical factors associated with surface gene variants among hepatitis B virus carriers". Antivir Ther. 12 (8): 1255–1263. 2007. PMID 18240865.
  16. "Reliable prediction of T‐cell epitopes using neural networks with novel sequence representations" (PDF). Protein Science. 12 (5): 1007–1017. 2003. doi:10.1110/ps.0239403.
  17. "The Statistics of Sequence Similarity Scores". National Centre for Biotechnology Information. Retrieved 20 October 2013.
  18. Saud, Omama (2009). "PAM and BLOSSUM SUBSITUTION MATRICES". Birec. Retrieved 20 October 2013.
  19. "The art of aligning protein sequences Part 1 Matrices". Dai hoc Can Tho - Can Tho University. Retrieved 7 September 2014.

لینک های خارجی