بلوسام: تفاوت میان نسخهها
Fatemehbeigi (بحث | مشارکتها) |
Fatemehbeigi (بحث | مشارکتها) ایجاد شده توسط ترجمهٔ صفحهٔ «BLOSUM» |
||
خط ۱: | خط ۱: | ||
[[پرونده:BLOSUM62. |
[[پرونده:BLOSUM62.gif|بندانگشتی|400x400پیکسل|این BLOSUM62 ماتریس]] |
||
ماتریسهای |
ماتریسهای بلوسام (BLOSUM) ( ماتریس بلوکهای جایگزینی) یک ماتریس جایگزینی است که در همتراز کردن توالیهای پروتئینی استفاده میشود. این ماتریس ها برای امتیازدهی هم ترازی های توالی های پروتئینی که در تکامل از یکدیگر متمایز شده اند، استفاده می شود و بر مبنای همترازی محلی میباشند. ماتریس بلوسام برای اولین بر در مقالهای توسط Henikoff معرفی شد.<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> آنها پایگاه دادهٔ بلوکها را برای پیدا کردن مناطق حفاظت شده در پروتئینها پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانسهای آمینو اسیدهای مرتبط و احتمالهای جایگزینی را به دست آوردند.سپس امتیاز لوجیت هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند.بر خلاف ماتریسهای PAM که بر پایه مقایسه بین پروتئین نزدیک برونیابی میشود، ماتریسهای بلوسام بر پایهٔ هم ترازیهای مشاهدهشده ساخته شدهاست. |
||
== |
== پس زمینه ی زیستی == |
||
دستورالعمل های |
دستورالعمل های ژنتیکی هر سلول از یک موجود زنده در DNA آن ذخیره شده است. <ref name="campbell-ch16">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=307–325}}</ref> در طول حیات سلول، این اطلاعات برای تولید پروتئین و یا برای تقسیم سلولی رونویسی می شوند و احتمال آن وجود دارد که این محتویات در حین این فرآیند ها دستخوش تغییر شوند.<ref name="campbell-ch16">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=307–325}}</ref><ref name="campbell-ch17">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=327–350}}</ref> این تغییر به عنوان جهش شناخته شده است. در سطح مولکولی سیستم های تنظیم کننده ای هستند که بیشتر این جهش ها را اصلاح می کنند.<ref name="campbell-ch17">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=327–350}}</ref><ref name="pal">{{Cite book|title=Fundamentals of Molecular Biology|publisher=Oxford University Press|year=2009|isbn=9780195697810|edition=1st|pages=187–203}}</ref> |
||
عملکرد پروتئین ها بسیار وابسته به ساختار آن ها است. تغییر یک [[اسید آمینه|آمینواسید]] در پروتئین ممکن است کارآمدی آن را برای انجام وظیفه ی مربوطه کاهش و یا کارکرد آن را تغییر دهد. تغییرات این چنینی می توانند یک عملکرد حیاتی در سلول را مختل کنند و یا حتی منجر به مرگ سلول شوند. |
|||
عملکرد پروتئین ها بسیار وابسته به ساختار آن ها است.<ref name="campbell-ch5">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=68–89}}</ref> تغییر یک آمینواسید در پروتئین ممکن است کارآمدی آن را برای انجام وظیفه ی مربوطه کاهش و یا کارکرد آن را تغییر دهد.<ref name="campbell-ch17">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=327–350}}</ref> تغییرات این چنینی می توانند یک عملکرد حیاتی در سلول را مختل کنند و یا حتی منجر به مرگ سلول شوند. <ref>{{Cite journal|url=http://www.nature.com/scitable/topicpage/mendelian-ratios-and-lethal-genes-557|title=Mendelian Ratios and Lethal Genes|last=Lobo|first=Ingrid|publisher=[[Nature Publishing Group]]|accessdate=19 October 2013|year=2008}}</ref> |
|||
در مقابل، این تغییر ممکن است به سلول اجازه ادامه ی فعالیت هرچند متفاوت را بدهدو جهش به فرزندان موجودات زنده منتقل شود. اگر این تغییر باعث ضعف جسمی قابل توجهی نشود این احتمال وجود دارد که جهش در جمعیت باقی بماند. همچنین این امکان وجود دارد که تغییر در عملکرد یک تغییر مفید باشد. |
در مقابل، این تغییر ممکن است به سلول اجازه ادامه ی فعالیت هرچند متفاوت را بدهدو جهش به فرزندان موجودات زنده منتقل شود. اگر این تغییر باعث ضعف جسمی قابل توجهی نشود این احتمال وجود دارد که جهش در جمعیت باقی بماند. همچنین این امکان وجود دارد که تغییر در عملکرد یک تغییر مفید باشد. |
||
20 اسید آمینه ترجمه شده توسط |
20 اسید آمینه ترجمه شده توسط کد ژنتیکی تا حدود زیادی از نظر خواص فیزیکی و شیمیایی زنجیره های جانبی آنها متفاوت هستند.<ref name="campbell-ch5">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=68–89}}</ref> این اسیدهای آمینه می تواند به طبقه بندی به گروه های مشابه با خواص فيزيکوشيميايی.<ref name="campbell-ch5">{{Cite book|title=Biology: Australian Version|last=Campbell NA|last2=Reece JB|last3=Meyers N|last4=Urry LA|last5=Cain ML|last6=Wasserman SA|last7=Minorsky PV|last8=Jackson RB|publisher=Pearson Education Australia|year=2009|isbn=9781442502215|edition=8th|pages=68–89}}</ref> جایگزین کردن یک اسید آمینه با یکی دیگر از همان دسته است بیشتر احتمال دارد به یک کوچکتر تاثیر بر ساختار و عملکرد پروتئین از جایگزینی با یک اسید آمینه از رده های مختلف. |
||
همترازی توالی ها یک روش اساسی برای تحقیقات زیست شناسی مدرن است. رایج ترین همردیفی توالی های پروتئین، جستجوی شباهت بین توالی های مختلف به منظور فهم تفاوت تکاملی توالی های پروتئینی به منظور پیش بینی وظیفه ی ژن های جهش یافته است. ماتریس ها در اگوریتم های محاسبه ی میزان شباهت توالی ها استفاده می شوند. |
همترازی توالی ها یک روش اساسی برای تحقیقات زیست شناسی مدرن است. رایج ترین همردیفی توالی های پروتئین، جستجوی شباهت بین توالی های مختلف به منظور فهم تفاوت تکاملی توالی های پروتئینی به منظور پیش بینی وظیفه ی ژن های جهش یافته است. ماتریس ها در اگوریتم های محاسبه ی میزان شباهت توالی ها استفاده می شوند. |
||
ماتریس به عنوان الگوریتم برای محاسبه شباهت توالی های مختلف از پروتئین استفاده شود. با این حال، ابزار Dayhoff ماتریس که یک روش به طور گسترده استفاده محدود است به علت قبل از نیاز به توالی با شباهت بیش از 85٪ است. به منظور پر کردن شکاف در ESTA، Henikoff و Henikoff معرفی بلوسام (بلوک تعویض ماتریکس) ماتریس که به اصلاحاتی را در صف و در جستجو با استفاده از نمایش داده شد از هر یک از گروه پروتئین مرتبط منجر شده است. |
|||
<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> |
|||
== اصطلاحات == |
|||
ماتریس به عنوان الگوریتم برای محاسبه شباهت توالی های مختلف از پروتئین استفاده شود. با این حال، ابزار Dayhoff ماتریس که یک روش به طور گسترده استفاده محدود است به علت قبل از نیاز به توالی با شباهت بیش از 85٪ است. به منظور پر کردن شکاف در ESTA، Henikoff و Henikoff معرفی بلوسام (بلوک تعویض ماتریکس) ماتریس که به اصلاحاتی را در صف و در جستجو با استفاده از نمایش داده شد از هر یک از گروه پروتئین مرتبط منجر شده است. [1] |
|||
بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود. |
|||
بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود. |
|||
== واژگان == |
|||
بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود. |
|||
ماتریس های امتیازدهی (آمار در مقابل زیست شناسی) : برای معنا یافتن ارزیابی هم ترازی توالی ها نیاز به ماتریس امتیازدهی و یا جدولی است که بیانگر احتمال جایگزینی معنادار جفت آمینواسید ها و یا جفت نوکلئوتیدها در یک همتراری است. امتیاز ها برای هر موقعیت مکانی از همترازی محلی پروتئین ها بدست می آیند.<ref name="pertsemlidis">{{Cite journal|title=Having a BLAST with bioinformatics (and avoiding BLASTphemy)|last=pertsemlidis A.|last2=Fondon JW.3rd|date=September 2001|journal=genome biology|issue=10|volume=2|pages=reviews2002.1-2002.10|pmid=11597340}}</ref> |
|||
ماتریس های امتیازدهی (آمار در مقابل زیست شناسی) : برای معنا یافتن ارزیابی هم ترازی توالی ها نیاز به ماتریس امتیازدهی و یا جدولی است که بیانگر احتمال جایگزینی معنادار جفت آمینواسید ها و یا جفت نوکلئوتیدها در یک همتراری است. امتیاز ها برای هر موقعیت مکانی از همترازی محلی پروتئین ها بدست می آیند. |
|||
دسته های متعددی از ماتریس های بلوسام با استفاده از پایگاه های داده وابسته به هم ترازی های متفاوت وجود دارند که با عددهای متفاوت نامگذاری می شوند. |
دسته های متعددی از ماتریس های بلوسام با استفاده از پایگاه های داده وابسته به هم ترازی های متفاوت وجود دارند که با عددهای متفاوت نامگذاری می شوند. |
||
ماتریس های بلوسام با اعداد بزرگتر برای مقایسه ی توالی های نزدیک به هم طراحی شده اند در حالیکه ماتریس هایی با اعداد کوچکتر این عمل را برای توالی های نسبتا دور انجام می دهند. به عنوان مثال BLOSUM80 برای هم ترازی توالی هایی با تفاوت کمتر و BLOSUM45 برای هم تراری توالی های متفاوت تر استفاده می شود |
|||
ماتریسها توسط ادغام کردن همهٔ دنبالههایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنبالهها را مقایسه میکند.درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنبالههایی با یکسانی بیش از ۸۰ درصد تولید میشود.<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> |
|||
ماتریس های بلوسام با اعداد بزرگتر برای مقایسه ی توالی های نزدیک به هم طراحی شده اند در حالیکه ماتریس هایی با اعداد کوچکتر این عمل را برای توالی های نسبتا دور انجام می دهند. به عنوان مثال BLOSUM80 برای هم ترازی توالی هایی با تفاوت کمتر و BLOSUM45 برای هم تراری توالی های متفاوت تر استفاده می شود |
|||
ماتریسها توسط ادغام کردن همهٔ دنبالههایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنبالهها را مقایسه میکند.درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنبالههایی با یکسانی بیش از ۸۰ درصد تولید میشود. |
|||
== ساخت ماتریس های بلوسام == |
== ساخت ماتریس های بلوسام == |
||
ماتریس های بلوسام با استفاده از اعمال روش های آماری بر بلوک های آمینواسیدهای مشابه برای بدست آوردن امتیازهای شباهت بدست می آیند. |
ماتریس های بلوسام با استفاده از اعمال روش های آماری بر بلوک های آمینواسیدهای مشابه برای بدست آوردن امتیازهای شباهت بدست می آیند. |
||
مراحل روش های آماری: <ref>{{Cite web|url=http://web.utm.my/aibig/images/saberi/Bioinformatics/blosum_matrices_slides_final.pdf|title=BLOSSUM MATRICES: Introduction to BIOINFORMATICS|accessdate=9 September 2014|website=UNIVERSITI TEKNOLOGI MALAYSIA|year=2009}}</ref> |
|||
=== حذف توالی === |
|||
مراحل روش های آماری: |
|||
=== حذف توالی ها === |
|||
حذف توالی های با میزان شباهت بیشتر از r%. |
حذف توالی های با میزان شباهت بیشتر از r%. |
||
دو روش برای حذف توالی ها وجود دارد. یا می توان توالی ها را از بلوک مربوطه حذف کرد و یا توالی های مشابه را یافته و با توالی های جدیدی که می توانید نماینده ی خوشه های مربوطه باشند جایگزین نمود. این عمل برای جلوگیری از بایاس نتیجه به نفع پروتئین های مشابه صورت می گیرد. |
|||
=== محاسبه فرکانس و احتمال === |
|||
دو روش برای حذف توالی ها وجود دارد. یا می توان توالی ها را از بلوک مربوطه حذف کرد و یا توالی های مشابه را یافته و با توالی های جدیدی که می توانید نماینده ی خوشه های مربوطه باشند جایگزین نمود. این عمل برای جلوگیری از بایاس نتیجه به نفع پروتئین های مشابه صورت می گیرد. |
|||
=== محاسبه ی فرکانس و احتمال === |
|||
پایگاه داده ای برای ذخیره سازی هم ترازی توالی هایی از نواحی با بیشترین حفاظت از خانواده ی پروتئین ها. این هم ترازی ها برای بدست آوردن ماتریس بلوسام استفاده می شوند.نواحی حفاظت شده ، نواحی ای از آمینواسید ها هستند که تغییر جزئی بین آن ها وجود دارد. |
پایگاه داده ای برای ذخیره سازی هم ترازی توالی هایی از نواحی با بیشترین حفاظت از خانواده ی پروتئین ها. این هم ترازی ها برای بدست آوردن ماتریس بلوسام استفاده می شوند.نواحی حفاظت شده ، نواحی ای از آمینواسید ها هستند که تغییر جزئی بین آن ها وجود دارد. |
||
خط ۴۲: | خط ۴۱: | ||
از رابطه ی زیر بدست می آید. |
از رابطه ی زیر بدست می آید. |
||
<math /> |
|||
<math>LogOddRatio = 2log_2( P(O)/P(E) ) </math> |
|||
که <math |
که در آن <math /> احتمال مشاهده شده و <math /> احتمال مورد انتظار است. |
||
=== ماتریس |
=== BLOSUM ماتریس === |
||
میزای شانس شباهت توسط نرخ Log Odd محاسبه شده و ماتریس های بلوسام از گرد کردن این مقادیر بدست می آیند. |
میزای شانس شباهت توسط نرخ Log Odd محاسبه شده و ماتریس های بلوسام از گرد کردن این مقادیر بدست می آیند. |
||
=== امتیاز ماتریس های بلوسام === |
=== امتیاز ماتریس های بلوسام === |
||
یک ماتریس امتیازدهی و یا جدولی از مقادیر برای ارزیابی اهمیت هم ترازی توالی ها مورد نیاز است. به طور کلی وقتی دو توالی نوکلئوتیدی مقایسه می شوندتمامی آن چه در امتیازدهی در نظرگرفته می شود آن است که دو باز در مکان های متناظر یکسان هستند یا نه. تمامی برابری ها و عدم برابری ها امتیاز یکسانی دارند. ولی این قضیه در رابطه با پروتئین ها متفاوت است و ماتریس های جایگزینی برای آمینواسیدها پیچیده تر هستند و تمامی عواملی که ممکن است فرکانس جایگزینی را تغییر دهد در نظر گرفته می شوند که در نتیجه ی آن پنالتی نسبتا زیاد برای همترازی هایی است که احتمال همولوگ بودن آن ها پایین است. |
یک ماتریس امتیازدهی و یا جدولی از مقادیر برای ارزیابی اهمیت هم ترازی توالی ها مورد نیاز است. به طور کلی وقتی دو توالی نوکلئوتیدی مقایسه می شوندتمامی آن چه در امتیازدهی در نظرگرفته می شود آن است که دو باز در مکان های متناظر یکسان هستند یا نه. تمامی برابری ها و عدم برابری ها امتیاز یکسانی دارند.<ref>{{Cite web|url=http://www.cs.uic.edu/~msivaram/Bio_Tools.PDF|title=CS#594 - Group 13 (Tools and softwares)|accessdate=9 September 2014|website=University of Illinois at Chicago - UIC|last=Murali Sivaramakrishnan|last2=Ognjen Perisic|last3=Shashi Ranjan}}</ref> ولی این قضیه در رابطه با پروتئین ها متفاوت است و ماتریس های جایگزینی برای آمینواسیدها پیچیده تر هستند و تمامی عواملی که ممکن است فرکانس جایگزینی را تغییر دهد در نظر گرفته می شوند که در نتیجه ی آن پنالتی نسبتا زیاد برای همترازی هایی است که احتمال همولوگ بودن آن ها پایین است.<ref name="pertsemlidis">{{Cite journal|title=Having a BLAST with bioinformatics (and avoiding BLASTphemy)|last=pertsemlidis A.|last2=Fondon JW.3rd|date=September 2001|journal=genome biology|issue=10|volume=2|pages=reviews2002.1-2002.10|pmid=11597340}}</ref> |
||
ماتریس های جایگزینی ای که به صورت عمده استفاده می شوند ماتریس های بلوسام (BLOSUM) و ماتریس های جهش نقطه ای پذیرفته شده (PAM) |
ماتریس های جایگزینی ای که به صورت عمده استفاده می شوند ماتریس های بلوسام (BLOSUM) <ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> و ماتریس های جهش نقطه ای پذیرفته شده (PAM) <ref name="dayhoff">{{Cite book|title=Atlas of Protein Sequence and Structure|last=Margaret O.|first=Dayhoff|date=1978|publisher=National Biomedical Research Foundation|volume=5|location=Washington DC|pages=345–352|chapter=22}}</ref><ref name="States">{{Cite journal|title=Improved sensitivity of nucleic acid database searches using application-specific scoring matrices.|last=States DJ.|last2=Gish W.|journal=Methods: A Companion to Methods in Enzymology|doi=10.1016/s1046-2023(05)80165-3|year=1991|volume=3|pages=66–70|issn=1046-2023|last3=Altschul SF.}}</ref> هستند.این دو ماتریس با روش های متفاوتی محاسبه می شوند.<ref name="pertsemlidis">{{Cite journal|title=Having a BLAST with bioinformatics (and avoiding BLASTphemy)|last=pertsemlidis A.|last2=Fondon JW.3rd|date=September 2001|journal=genome biology|issue=10|volume=2|pages=reviews2002.1-2002.10|pmid=11597340}}</ref> |
||
امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت درستنمایی دو آمینو اسید که بیولوژیکی ظاهر شدهاند به درستنمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شدهاند، محاسبه میشود.مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه میدهد.<ref name="handbook">{{Cite book|url=https://books.google.com/books?id=kDFltuQo1dMC&pg=PA673&lpg=PA673&dq=blosum+matrix|title=Handbook of Nature-Inspired And Innovative Computing|last=Albert Y. Zomaya|publisher=Springer|year=2006|isbn=0-387-40532-1|location=New York, NY}}</ref> <ref>[http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Scoring2.html NIH "Scoring Systems"]</ref> |
|||
تساوی زیر برای محاسبه ماتریس BLOSUM استفاده میشود: |
|||
: <math /> |
|||
در اینجا <math /> احتمال جابجا شدن دو آمینو اسید <math /> و <math /> در دنبالههای مشابه (آنالوگ) و <math /> و <math /> احتمال رخ دادن آمینو اسید <math /> و <math /> به صورت تصادفی در دنباله پروتیینها میباشد.به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور <math /> استفاده میکنیم. |
|||
== مثال - BLOSUM62 == |
|||
امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت [[درستنمایی]] دو [[آمینو اسید]] که بیولوژیکی ظاهر شدهاند به درستنمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شدهاند، محاسبه میشود.مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه میدهد. |
|||
تساوی زیر برای محاسبه ماتریس BLOSUM استفاده میشود: |
|||
:<math>S_{ij}= \left(\frac{1}{\lambda} \right)\log{\left(\frac{p_{ij}}{q_i * q_j} \right)}</math> |
|||
در اینجا <math>p_{ij}</math> احتمال جابجا شدن دو آمینو اسید <math>i</math> و <math>j</math> در دنبالههای مشابه (آنالوگ) و <math>q_i</math> و <math>q_j</math> احتمال رخ دادن آمینو اسید <math>i</math> و <math>j</math> به صورت تصادفی در دنباله پروتیینها میباشد.به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور <math>\lambda</math> استفاده میکنیم. |
|||
== نمونه های بلوسام == |
|||
بلوسام62: پروتئین های با ارتباط متوسط |
بلوسام62: پروتئین های با ارتباط متوسط |
||
بلوسام80: پروتئین های مرتبط تر |
بلوسام80: پروتئین های مرتبط تر |
||
بلوسام |
|||
45: پروتئین های با ارتباط کمتر |
|||
مقالهای در Nature Biotechnology نشان داد کهBLOSUM۶۲ که سالیان سال است به عنوان استاندارد استفاده میشود طبق الگوریتمی که هنیکوف ارائه داده دقیقاً صحیح نیست.در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا میدهد. |
مقالهای در Nature Biotechnology <ref name="article">{{Cite journal|url=http://www.nature.com/nbt/journal/v26/n3/full/nbt0308-274.html|title=BLOSUM62 miscalculations improve search performance|last=Mark P Styczynski|last2=Kyle L Jensen|journal=Nat. Biotechnol.|issue=3|doi=10.1038/nbt0308-274|year=2008|volume=26|pages=274–275|pmid=18327232|last3=Isidore Rigoutsos|last4=Gregory Stephanopoulos}}</ref> نشان داد کهBLOSUM۶۲ که سالیان سال است به عنوان استاندارد استفاده میشود طبق الگوریتمی که هنیکوف ارائه داده دقیقاً صحیح نیست.<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا میدهد. <ref name="article">{{Cite journal|url=http://www.nature.com/nbt/journal/v26/n3/full/nbt0308-274.html|title=BLOSUM62 miscalculations improve search performance|last=Mark P Styczynski|last2=Kyle L Jensen|journal=Nat. Biotechnol.|issue=3|doi=10.1038/nbt0308-274|year=2008|volume=26|pages=274–275|pmid=18327232|last3=Isidore Rigoutsos|last4=Gregory Stephanopoulos}}</ref> |
||
== برخی از کاربردهای ماتریس بلوسام در بیوانفورماتیک == |
|||
=== کاربردهای پژوهشی === |
|||
امتیاز های بلوسام در پیش بینی و درک انواع ژن سطحی در میان حامل های ویروس هپاتیت B حامل<ref name="Roque-Afonso">{{Cite journal|title=Viral and clinical factors associated with surface gene variants among hepatitis B virus carriers.|journal=Antivir Ther|issue=8|year=2007|volume=12|pages=1255–1263|pmid=18240865}}</ref> و اپی توپ های لنفوسیت تی مورد استفاده قرار گرفته است <ref name="Nielsen">{{Cite journal|url=http://tools.immuneepitope.org/analyze/pdf/nielsen_2003_protein_sci.pdf|title=Reliable prediction of T‐cell epitopes using neural networks with novel sequence representations|journal=Protein Science|issue=5|doi=10.1110/ps.0239403|year=2003|volume=12|pages=1007–1017|display-authors=etal}}</ref> |
|||
=== استفاده در BLAST === |
|||
BLOSUM ماتریس های بلوسام هم چنین به عنوان ماتریس امتیاز دهی در مقایسه ی توالی های DNA و توالی های پروتئین برای ارزیابی کیفیت هم ترازی استفاده می شود . این شکل سیستم امتیازدهی مجهز به نرم افزارهای گسترده ای من جمله BLAST است. <ref>{{Cite web|url=http://www.ncbi.nlm.nih.gov/BLAST/tutorial/Altschul-1.html#head9|title=The Statistics of Sequence Similarity Scores|accessdate=20 October 2013|website=National Centre for Biotechnology Information}}</ref> |
|||
==== مقایسه PAM و BLOSUM ==== |
|||
علاوه بر ماتریس های BLOSUM ماتریسهای قبلا توسعه یافته [[جهش پذیرفته نقطهای|PAM]] می توانند استفاده شوند.<ref name="henikoff">{{Cite journal|title=Amino Acid Substitution Matrices from Protein Blocks|last=Henikoff, S.|last2=Henikoff, J.G.|journal=PNAS|issue=22|doi=10.1073/pnas.89.22.10915|year=1992|volume=89|pages=10915–10919|pmc=50453|pmid=1438297}}</ref> |
|||
از آنجا که هر دو ماتریس PAM و BLOSUM روش های متفاوتی برای نمایش اطلاعات امتیازدهی یکسان هستند می توان این دو را مقایسه نمود اما به دلیل تفاوت زیاد روش بدست آوردن این اطلاعات BLOSUM100 با PAM100 یکی نیست.<ref>{{Cite web|url=http://www.birec.org/sandbox/omamasaudtutorial|title=PAM and BLOSSUM SUBSITUTION MATRICES|accessdate=20 October 2013|website=Birec|last=Saud|first=Omama|year=2009}}</ref> |
|||
{| class="wikitable" style="margin: 1em auto 10px; text-align: center; width: 30%;" |
|||
! PAM |
|||
! BLOSUM |
|||
|- |
|||
| PAM100 |
|||
| BLOSUM90 |
|||
|- |
|||
| PAM120 |
|||
| BLOSUM80 |
|||
|- |
|||
| PAM160 |
|||
| BLOSUM60 |
|||
|- |
|||
| PAM200 |
|||
| BLOSUM52 |
|||
|- |
|||
| PAM250 |
|||
| BLOSUM45 |
|||
|} |
|||
== |
===== رابطه بین PAM و BLOSUM ===== |
||
{| class="wikitable" |
{| class="wikitable" style="margin: 1em auto 10px; text-align: center; width: 90%;" |
||
! PAM |
|||
|+ارتباط PAM و BLOSUM |
|||
!BLOSUM |
! BLOSUM |
||
!PAM |
|||
|- |
|- |
||
|برای مقایسه ی توالی های بسیار مرتبط، |
| برای مقایسه ی توالی های بسیار مرتبط، |
||
ماتریس های PAM با اعداد بزرگتر استفاده می شوند |
|||
|برای مقایسه ی توالی های بسیار مرتبط، |
|||
ماتریس های PAM با اعداد کمتر استفاده می شوند |
ماتریس های PAM با اعداد کمتر استفاده می شوند |
||
| برای مقایسه ی توالی های بسیار مرتبط، |
|||
ماتریس های BLOSUM با اعداد بزرگتر استفاده می شوند |
|||
|- |
|- |
||
|برای مقایسه ی توالی های با ارتباط کمتر |
| برای مقایسه ی توالی های با ارتباط کمتر |
||
ماتریس های PAM با اعداد کوچکتر استفاده می شوند |
|||
|برای مقایسه ی توالی های با ارتباط کمتر |
|||
ماتریس های PAM با اعدادبزرگتر استفاده می شوند |
ماتریس های PAM با اعدادبزرگتر استفاده می شوند |
||
| برای مقایسه ی توالی های با ارتباط کمتر |
|||
ماتریس های PAM با اعداد کوچکتر استفاده می شوند |
|||
|} |
|} |
||
{| class="wikitable" |
|||
===== تفاوت بین PAM و BLOSUM ===== |
|||
{| class="wikitable" style="margin: 1em auto 82px; text-align: center; width: 90%;" |
|||
!BLOSUM |
|||
!PAM |
! PAM |
||
! BLOSUM |
|||
|- |
|- |
||
|بر مبنای هم ترازی |
|بر مبنای هم ترازی گلوبال |
||
توالی های نزدیک هم است |
|||
|بر مبنای هم ترازی [[جهانیگرایی|گلوبال]] |
|||
|بر مبنای هم ترازی محلی است |
|||
|- |
|- |
||
|BLOSUM62 ماتریسی است که از مقایسه ی توالی هایی بدست می آید |
|||
که کمتر از 62% به هم شبیه هستند |
|||
|PAM1 ماتریسی است که از مقایسه ی توالی هایی |
|PAM1 ماتریسی است که از مقایسه ی توالی هایی |
||
بدست می آید که کمتر از 1% اختلاف دارند. |
بدست می آید که کمتر از 1% اختلاف دارند. |
||
|BLOSUM62 ماتریسی است که از مقایسه ی توالی هایی بدست می آید |
|||
که کمتر از 62% به هم شبیه هستند |
|||
|- |
|- |
||
|بر مبنای هم ترازی های مشاهده شده است |
|||
و از توالی های پروتئین نزدیک برون یابی نشده است. |
|||
|سایر ماتریس های PAM از برون یابی ماتریس PAM1 بدست آمده اند. |
|سایر ماتریس های PAM از برون یابی ماتریس PAM1 بدست آمده اند. |
||
|بر مبنای هم ترازی های مشاهده شده است |
|||
و از توالی های پروتئین نزدیک برون یابی نشده است. |
|||
|- |
|- |
||
|عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر فاصله ی تکاملی بیشتر است. |
|||
|عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر |
|عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر |
||
میزان شباهت بیشتر در توالی ها و در نتیجه فاصله ی تکاملی کمتر است. |
میزان شباهت بیشتر در توالی ها و در نتیجه فاصله ی تکاملی کمتر است. |
||
<ref>{{Cite web|url=http://www.ctu.edu.vn/~dvxe/Bioinformatic%20course/mod4/mod4_0.html|title=The art of aligning protein sequences Part 1 Matrices|accessdate=7 September 2014|website=Dai hoc Can Tho - Can Tho University}}</ref> |
|||
|عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر فاصله ی تکاملی بیشتر است. |
|||
|} |
|} |
||
== جستارهای وابسته == |
== جستارهای وابسته == |
||
* [[همترازسازی توالی|دنباله تراز]] |
|||
* [[همتراز کردن توالی]] |
|||
* [[نقطه |
* [[جهش پذیرفته نقطهای|نقطه پذیرفته جهش]] |
||
== منابع == |
== منابع == |
||
{{reflist|2}} |
|||
== |
== لینک های خارجی == |
||
* {{Cite journal|title=Where did the BLOSUM62 alignment score matrix come from?|last=Sean R. Eddy|journal=Nature Biotechnology|issue=8|doi=10.1038/nbt0804-1035|year=2004|volume=22|pages=1035–6|pmid=15286655}} |
|||
* BLOSUM. (۲۰۱۱، April ۷). In Wikipedia، The Free Encyclopedia. Retrieved ۱۸:۴۸، June ۲۶، ۲۰۱۱، from http://en.wikipedia.org/w/index.php?title=BLOSUM&oldid=422872426 |
|||
* [http:// |
* [http://blocks.fhcrc.org/ بلوک WWW سرور] |
||
* [http://www.ncbi.nlm.nih.gov/BLAST/tutorial/Altschul-1.html سیستم امتیاز دهی برای انفجار در NCBI] |
|||
* {{cite journal |journal=Nature Biotechnology | title=Where did the BLOSUM62 alignment score matrix come from? | author=Sean R. Eddy | doi=10.1038/nbt0804-1035 | pmid=15286655 | year=2004 | volume=22 | pages=1035 | issue=8}} |
|||
* [ftp://ftp.ncbi.nih.gov/blast/matrices/ فایل های داده از BLOSUM در NCBI سرور FTP]. |
|||
* [http://blocks.fhcrc.org/ BLOCKS WWW server] |
|||
* [http://ahmetrasit.com/blosum/ تعاملی BLOSUM شبکه تجسم] |
|||
* [http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/Scoring2.html Scoring systems for BLAST at NCBI] |
|||
[[رده:روشهای بیوشیمی]] |
|||
* [ftp://ftp.ncbi.nih.gov/blast/matrices/ Data files of BLOSUM on the NCBI FTP server]. |
|||
[[رده:بیوانفورماتیک]] |
[[رده:بیوانفورماتیک]] |
||
[[رده: |
[[رده:فیلوژنتیک رایانشی]] |
||
[[رده:ژنتیک]] |
[[رده:ژنتیک]] |
||
[[رده:فیلوژنتیک رایانشی]] |
|||
[[رده:ماتریسها]] |
[[رده:ماتریسها]] |
نسخهٔ ۳۰ دسامبر ۲۰۱۶، ساعت ۱۶:۴۳
ماتریسهای بلوسام (BLOSUM) ( ماتریس بلوکهای جایگزینی) یک ماتریس جایگزینی است که در همتراز کردن توالیهای پروتئینی استفاده میشود. این ماتریس ها برای امتیازدهی هم ترازی های توالی های پروتئینی که در تکامل از یکدیگر متمایز شده اند، استفاده می شود و بر مبنای همترازی محلی میباشند. ماتریس بلوسام برای اولین بر در مقالهای توسط Henikoff معرفی شد.[۱] آنها پایگاه دادهٔ بلوکها را برای پیدا کردن مناطق حفاظت شده در پروتئینها پیمایش کردند (مناطقی که در هم ترازی دنباله وقفه وجود ندارد) و فرکانسهای آمینو اسیدهای مرتبط و احتمالهای جایگزینی را به دست آوردند.سپس امتیاز لوجیت هر ۲۱۰ جایگزینی ممکن بین ۲۰ پروتئین استاندارد را محاسبه نمودند.بر خلاف ماتریسهای PAM که بر پایه مقایسه بین پروتئین نزدیک برونیابی میشود، ماتریسهای بلوسام بر پایهٔ هم ترازیهای مشاهدهشده ساخته شدهاست.
پس زمینه ی زیستی
دستورالعمل های ژنتیکی هر سلول از یک موجود زنده در DNA آن ذخیره شده است. [۲] در طول حیات سلول، این اطلاعات برای تولید پروتئین و یا برای تقسیم سلولی رونویسی می شوند و احتمال آن وجود دارد که این محتویات در حین این فرآیند ها دستخوش تغییر شوند.[۲][۳] این تغییر به عنوان جهش شناخته شده است. در سطح مولکولی سیستم های تنظیم کننده ای هستند که بیشتر این جهش ها را اصلاح می کنند.[۳][۴]
عملکرد پروتئین ها بسیار وابسته به ساختار آن ها است.[۵] تغییر یک آمینواسید در پروتئین ممکن است کارآمدی آن را برای انجام وظیفه ی مربوطه کاهش و یا کارکرد آن را تغییر دهد.[۳] تغییرات این چنینی می توانند یک عملکرد حیاتی در سلول را مختل کنند و یا حتی منجر به مرگ سلول شوند. [۶] در مقابل، این تغییر ممکن است به سلول اجازه ادامه ی فعالیت هرچند متفاوت را بدهدو جهش به فرزندان موجودات زنده منتقل شود. اگر این تغییر باعث ضعف جسمی قابل توجهی نشود این احتمال وجود دارد که جهش در جمعیت باقی بماند. همچنین این امکان وجود دارد که تغییر در عملکرد یک تغییر مفید باشد.
20 اسید آمینه ترجمه شده توسط کد ژنتیکی تا حدود زیادی از نظر خواص فیزیکی و شیمیایی زنجیره های جانبی آنها متفاوت هستند.[۵] این اسیدهای آمینه می تواند به طبقه بندی به گروه های مشابه با خواص فيزيکوشيميايی.[۵] جایگزین کردن یک اسید آمینه با یکی دیگر از همان دسته است بیشتر احتمال دارد به یک کوچکتر تاثیر بر ساختار و عملکرد پروتئین از جایگزینی با یک اسید آمینه از رده های مختلف.
همترازی توالی ها یک روش اساسی برای تحقیقات زیست شناسی مدرن است. رایج ترین همردیفی توالی های پروتئین، جستجوی شباهت بین توالی های مختلف به منظور فهم تفاوت تکاملی توالی های پروتئینی به منظور پیش بینی وظیفه ی ژن های جهش یافته است. ماتریس ها در اگوریتم های محاسبه ی میزان شباهت توالی ها استفاده می شوند. ماتریس به عنوان الگوریتم برای محاسبه شباهت توالی های مختلف از پروتئین استفاده شود. با این حال، ابزار Dayhoff ماتریس که یک روش به طور گسترده استفاده محدود است به علت قبل از نیاز به توالی با شباهت بیش از 85٪ است. به منظور پر کردن شکاف در ESTA، Henikoff و Henikoff معرفی بلوسام (بلوک تعویض ماتریکس) ماتریس که به اصلاحاتی را در صف و در جستجو با استفاده از نمایش داده شد از هر یک از گروه پروتئین مرتبط منجر شده است. [۱]
اصطلاحات
بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود.
بلوسام : ماتریس جایگزینی بلوک ها، یک ماتریس جایگزینی که برای هم ترازی توالی های پروتئین استفاده می شود.
ماتریس های امتیازدهی (آمار در مقابل زیست شناسی) : برای معنا یافتن ارزیابی هم ترازی توالی ها نیاز به ماتریس امتیازدهی و یا جدولی است که بیانگر احتمال جایگزینی معنادار جفت آمینواسید ها و یا جفت نوکلئوتیدها در یک همتراری است. امتیاز ها برای هر موقعیت مکانی از همترازی محلی پروتئین ها بدست می آیند.[۷]
دسته های متعددی از ماتریس های بلوسام با استفاده از پایگاه های داده وابسته به هم ترازی های متفاوت وجود دارند که با عددهای متفاوت نامگذاری می شوند.
ماتریس های بلوسام با اعداد بزرگتر برای مقایسه ی توالی های نزدیک به هم طراحی شده اند در حالیکه ماتریس هایی با اعداد کوچکتر این عمل را برای توالی های نسبتا دور انجام می دهند. به عنوان مثال BLOSUM80 برای هم ترازی توالی هایی با تفاوت کمتر و BLOSUM45 برای هم تراری توالی های متفاوت تر استفاده می شود
ماتریسها توسط ادغام کردن همهٔ دنبالههایی که از درصدی که به یک دنباله داده میشود شبیه تر هستند ساخته میشود، و سپس تنها آن دنبالهها را مقایسه میکند.درصد مذکور به نام ماتریس افزوده میشود. برای نمونه BLOSUM۸۰، از ادغام کردن دنبالههایی با یکسانی بیش از ۸۰ درصد تولید میشود.[۱]
ساخت ماتریس های بلوسام
ماتریس های بلوسام با استفاده از اعمال روش های آماری بر بلوک های آمینواسیدهای مشابه برای بدست آوردن امتیازهای شباهت بدست می آیند. مراحل روش های آماری: [۸]
حذف توالی
حذف توالی های با میزان شباهت بیشتر از r%. دو روش برای حذف توالی ها وجود دارد. یا می توان توالی ها را از بلوک مربوطه حذف کرد و یا توالی های مشابه را یافته و با توالی های جدیدی که می توانید نماینده ی خوشه های مربوطه باشند جایگزین نمود. این عمل برای جلوگیری از بایاس نتیجه به نفع پروتئین های مشابه صورت می گیرد.
محاسبه فرکانس و احتمال
پایگاه داده ای برای ذخیره سازی هم ترازی توالی هایی از نواحی با بیشترین حفاظت از خانواده ی پروتئین ها. این هم ترازی ها برای بدست آوردن ماتریس بلوسام استفاده می شوند.نواحی حفاظت شده ، نواحی ای از آمینواسید ها هستند که تغییر جزئی بین آن ها وجود دارد.
نرخ Log Odd
از رابطه ی زیر بدست می آید.
که در آن احتمال مشاهده شده و احتمال مورد انتظار است.
BLOSUM ماتریس
میزای شانس شباهت توسط نرخ Log Odd محاسبه شده و ماتریس های بلوسام از گرد کردن این مقادیر بدست می آیند.
امتیاز ماتریس های بلوسام
یک ماتریس امتیازدهی و یا جدولی از مقادیر برای ارزیابی اهمیت هم ترازی توالی ها مورد نیاز است. به طور کلی وقتی دو توالی نوکلئوتیدی مقایسه می شوندتمامی آن چه در امتیازدهی در نظرگرفته می شود آن است که دو باز در مکان های متناظر یکسان هستند یا نه. تمامی برابری ها و عدم برابری ها امتیاز یکسانی دارند.[۹] ولی این قضیه در رابطه با پروتئین ها متفاوت است و ماتریس های جایگزینی برای آمینواسیدها پیچیده تر هستند و تمامی عواملی که ممکن است فرکانس جایگزینی را تغییر دهد در نظر گرفته می شوند که در نتیجه ی آن پنالتی نسبتا زیاد برای همترازی هایی است که احتمال همولوگ بودن آن ها پایین است.[۷]
ماتریس های جایگزینی ای که به صورت عمده استفاده می شوند ماتریس های بلوسام (BLOSUM) [۱] و ماتریس های جهش نقطه ای پذیرفته شده (PAM) [۱۰][۱۱] هستند.این دو ماتریس با روش های متفاوتی محاسبه می شوند.[۷]
امتیازات در بلوسام امتیازات log_odds هستند که در یک همترازی از نسبت درستنمایی دو آمینو اسید که بیولوژیکی ظاهر شدهاند به درستنمایی هر یک از دو آمینو اسیدی که به صورت اتفاقی ظاهر شدهاند، محاسبه میشود.مقدار مثبت، محتمل تر بودن جایگزینی و امتیاز منفی، غیر محتمل بودن جایگزینی را نتیجه میدهد.[۱۲] [۱۳]
تساوی زیر برای محاسبه ماتریس BLOSUM استفاده میشود:
در اینجا احتمال جابجا شدن دو آمینو اسید و در دنبالههای مشابه (آنالوگ) و و احتمال رخ دادن آمینو اسید و به صورت تصادفی در دنباله پروتیینها میباشد.به منظور اینکه ماتریس حاوی مقادیر صحیح ساده باشد از فاکتور استفاده میکنیم.
مثال - BLOSUM62
بلوسام62: پروتئین های با ارتباط متوسط
بلوسام80: پروتئین های مرتبط تر
بلوسام
45: پروتئین های با ارتباط کمتر
مقالهای در Nature Biotechnology [۱۴] نشان داد کهBLOSUM۶۲ که سالیان سال است به عنوان استاندارد استفاده میشود طبق الگوریتمی که هنیکوف ارائه داده دقیقاً صحیح نیست.[۱] در کمال تعجب، بلوسام اشتباه محاسبه شده، کارایی جستجو را ارتقا میدهد. [۱۴]
برخی از کاربردهای ماتریس بلوسام در بیوانفورماتیک
کاربردهای پژوهشی
امتیاز های بلوسام در پیش بینی و درک انواع ژن سطحی در میان حامل های ویروس هپاتیت B حامل[۱۵] و اپی توپ های لنفوسیت تی مورد استفاده قرار گرفته است [۱۶]
استفاده در BLAST
BLOSUM ماتریس های بلوسام هم چنین به عنوان ماتریس امتیاز دهی در مقایسه ی توالی های DNA و توالی های پروتئین برای ارزیابی کیفیت هم ترازی استفاده می شود . این شکل سیستم امتیازدهی مجهز به نرم افزارهای گسترده ای من جمله BLAST است. [۱۷]
مقایسه PAM و BLOSUM
علاوه بر ماتریس های BLOSUM ماتریسهای قبلا توسعه یافته PAM می توانند استفاده شوند.[۱]
از آنجا که هر دو ماتریس PAM و BLOSUM روش های متفاوتی برای نمایش اطلاعات امتیازدهی یکسان هستند می توان این دو را مقایسه نمود اما به دلیل تفاوت زیاد روش بدست آوردن این اطلاعات BLOSUM100 با PAM100 یکی نیست.[۱۸]
PAM | BLOSUM |
---|---|
PAM100 | BLOSUM90 |
PAM120 | BLOSUM80 |
PAM160 | BLOSUM60 |
PAM200 | BLOSUM52 |
PAM250 | BLOSUM45 |
رابطه بین PAM و BLOSUM
PAM | BLOSUM |
---|---|
برای مقایسه ی توالی های بسیار مرتبط،
ماتریس های PAM با اعداد کمتر استفاده می شوند |
برای مقایسه ی توالی های بسیار مرتبط،
ماتریس های BLOSUM با اعداد بزرگتر استفاده می شوند |
برای مقایسه ی توالی های با ارتباط کمتر
ماتریس های PAM با اعدادبزرگتر استفاده می شوند |
برای مقایسه ی توالی های با ارتباط کمتر
ماتریس های PAM با اعداد کوچکتر استفاده می شوند |
تفاوت بین PAM و BLOSUM
PAM | BLOSUM |
---|---|
بر مبنای هم ترازی گلوبال
توالی های نزدیک هم است |
بر مبنای هم ترازی محلی است |
PAM1 ماتریسی است که از مقایسه ی توالی هایی
بدست می آید که کمتر از 1% اختلاف دارند. |
BLOSUM62 ماتریسی است که از مقایسه ی توالی هایی بدست می آید
که کمتر از 62% به هم شبیه هستند |
سایر ماتریس های PAM از برون یابی ماتریس PAM1 بدست آمده اند. | بر مبنای هم ترازی های مشاهده شده است
و از توالی های پروتئین نزدیک برون یابی نشده است. |
عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر فاصله ی تکاملی بیشتر است. | عددهای بزرگتر در نام گذاری این ماتریس ها بیانگر
میزان شباهت بیشتر در توالی ها و در نتیجه فاصله ی تکاملی کمتر است. [۱۹] |
جستارهای وابسته
منابع
- ↑ ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ ۱٫۴ ۱٫۵ Henikoff, S.; Henikoff, J.G. (1992). "Amino Acid Substitution Matrices from Protein Blocks". PNAS. 89 (22): 10915–10919. doi:10.1073/pnas.89.22.10915. PMC 50453. PMID 1438297.
- ↑ ۲٫۰ ۲٫۱ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. pp. 307–325. ISBN 9781442502215.
- ↑ ۳٫۰ ۳٫۱ ۳٫۲ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. pp. 327–350. ISBN 9781442502215.
- ↑ Fundamentals of Molecular Biology (1st ed.). Oxford University Press. 2009. pp. 187–203. ISBN 9780195697810.
- ↑ ۵٫۰ ۵٫۱ ۵٫۲ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. pp. 68–89. ISBN 9781442502215.
- ↑ Lobo, Ingrid (2008). "Mendelian Ratios and Lethal Genes". Nature Publishing Group. Retrieved 19 October 2013.
{{cite journal}}
: Cite journal requires|journal=
(help) - ↑ ۷٫۰ ۷٫۱ ۷٫۲ pertsemlidis A.; Fondon JW.3rd (September 2001). "Having a BLAST with bioinformatics (and avoiding BLASTphemy)". genome biology. 2 (10): reviews2002.1-2002.10. PMID 11597340.
- ↑ "BLOSSUM MATRICES: Introduction to BIOINFORMATICS" (PDF). UNIVERSITI TEKNOLOGI MALAYSIA. 2009. Retrieved 9 September 2014.
- ↑ Murali Sivaramakrishnan; Ognjen Perisic; Shashi Ranjan. "CS#594 - Group 13 (Tools and softwares)" (PDF). University of Illinois at Chicago - UIC. Retrieved 9 September 2014.
- ↑ Margaret O., Dayhoff (1978). "22". Atlas of Protein Sequence and Structure. Vol. 5. Washington DC: National Biomedical Research Foundation. pp. 345–352.
- ↑ States DJ.; Gish W.; Altschul SF. (1991). "Improved sensitivity of nucleic acid database searches using application-specific scoring matrices". Methods: A Companion to Methods in Enzymology. 3: 66–70. doi:10.1016/s1046-2023(05)80165-3. ISSN 1046-2023.
- ↑ Albert Y. Zomaya (2006). Handbook of Nature-Inspired And Innovative Computing. New York, NY: Springer. ISBN 0-387-40532-1.
- ↑ NIH "Scoring Systems"
- ↑ ۱۴٫۰ ۱۴٫۱ Mark P Styczynski; Kyle L Jensen; Isidore Rigoutsos; Gregory Stephanopoulos (2008). "BLOSUM62 miscalculations improve search performance". Nat. Biotechnol. 26 (3): 274–275. doi:10.1038/nbt0308-274. PMID 18327232.
- ↑ "Viral and clinical factors associated with surface gene variants among hepatitis B virus carriers". Antivir Ther. 12 (8): 1255–1263. 2007. PMID 18240865.
- ↑ "Reliable prediction of T‐cell epitopes using neural networks with novel sequence representations" (PDF). Protein Science. 12 (5): 1007–1017. 2003. doi:10.1110/ps.0239403.
- ↑ "The Statistics of Sequence Similarity Scores". National Centre for Biotechnology Information. Retrieved 20 October 2013.
- ↑ Saud, Omama (2009). "PAM and BLOSSUM SUBSITUTION MATRICES". Birec. Retrieved 20 October 2013.
- ↑ "The art of aligning protein sequences Part 1 Matrices". Dai hoc Can Tho - Can Tho University. Retrieved 7 September 2014.
لینک های خارجی
- Sean R. Eddy (2004). "Where did the BLOSUM62 alignment score matrix come from?". Nature Biotechnology. 22 (8): 1035–6. doi:10.1038/nbt0804-1035. PMID 15286655.
- بلوک WWW سرور
- سیستم امتیاز دهی برای انفجار در NCBI
- فایل های داده از BLOSUM در NCBI سرور FTP.
- تعاملی BLOSUM شبکه تجسم