ماتریس جایگزینی

از ویکی‌پدیا، دانشنامهٔ آزاد

ماتریس جایگزینی نوعی ماتریس تصادفی است که در زیست‌داده‌ورزی(بیوانفورماتیک) و زیست شناسی تکاملی برای هم‌ترازسازی توالی‌های پروتئین، دی‌ان‌ای و یا آران‌ای به کار می‌رود.

هر سطر و ستون ماتریس جایگزینی متناظر با یک تکپار (نوکلئوتید یا اسید آمینه) است و درایه‌های این ماتریس میزان احتمال تغییر یک تکپار به تکپاری دیگر را در اثر گذر زمان توصیف می‌کند.

پیش‌زمینه زیستی[ویرایش]

دستورالعمل‌های ژنتکی سلول‌های یک موجود زنده در دی‌ان‌ای آن ذخیره شده است. در طول حیات سلول، این اطلاعات بارها رونویسی شده و احتمال دارد که دی‌ان‌ای در حین این فرایندها دستخوش تغییر شود.این تغییرات جهش نامیده می‌شوند.[۱]

عملکرد پروتئین‌ها نیز بسیار به ساختارشان وابسته است. تغییر حتی یکی از آمینواسیدهای پروتئین ممکن است کارآمدی آن برای انجام وظیفه مربوطه اش کاهش دهد یا کارکرد آن را به طور کلی دچار تغییر کند.[۱]

ابزارهایی که هم‌ترازسازی توالی انجام می‌دهند از بین پرکاربردترین ابزارهای مبتنی بر رایانه اند که در زیست‌شناسی مدرن استفاده می‌شوند زیرا هم‌ترازسازی ها اطلاعات ارزشمندی در مورد کارکردهای ژن پروتئین‌ها می‌دهد. در هر روشی از هم‌ترازسازی از یک روش امتیازدهی برای تخمین شباهت استفاده می‌شود.[۲] از ماتریس‌های جایگزینی بدین منظور استفاده می‌شود.

انواع[ویرایش]

ماتریس‌های PAM و BLOSUM از پرکاربردترین ماتریس‌های جایگزینی اند. در محاسبه این ماتریس‌ها از لگاریتم نسبت شانس‌ها استفاده می‌شود.

در محاسبه ماتریس‌های log-odds به هر جفت آمینواسید تطبیق داده شده به صورت ضمنی یک بسامد هدف نسبت داده می‌شود که با نشان داده می‌شود و امتیاز یک جفت آمینواسید به صورت محاسبه می‌شود که و نشان‌دهنده بسامد آمینواسید‌های و است و پایه لگاریتم به دلخواه انتخاب می‌شود.[۳]

جهش پذیرفته نقطه‌ای[ویرایش]

یکی از اولین ماتریس‌های جایگزینی مربوط به آمینواسیدها ماتریس‌های جهش پذیرفته نقطه‌ای (PAM) هستند که در سال ۱۹۷۸ توسط مارگارت دایهوف معرفی شدند.[۴] محاسبه این ماتریس‌ها بر مبنای ۱۵۷۲ جهش مشاهده شده در درخت‌های تبارزایی ۷۱ خانواده پروتئین‌های بسیار مرتبط با یک‌دیگر انجام شده است. پروتئین هایی برای مطالعه انتخاب شدند که شباهت زیادی در واقع حداقل ۸۵٪ شباهت با اجدادشان داشته باشند.[۵][۶]پس معقول است که فرض کنیم که عدم تطابق‌ها در نتیجه تنها یک جهش نه چند جهش در آن جایگاه از رشته پروتئین بوده است. ماتریس‌های PAM از به توان رسیدن ماتریس PAM1 به دست آمده اند. استفاده از اعداد بزرگتر در نام‌گذاری این ماتریس‌ها نشان‌دهنده فاصله بیشتر است.

بلوسام[ویرایش]

ماتریس‌های بلوسام برای اولین بار در مقاله‌ای توسط هنی‌کاف معرفی شدند[۲]. در روند ساخت این ماتریس‌ها برای به دست آوردن فراوانی نسبی و احتمال جایگزینی آمینواسیدها از پایگاه داده بلوک‌ها برای پیدا کردن دنباله‌های تغییرنیافته در خانواده‌های پروتئین‌ها استفاده شده است. تمامی ماتریس‌های بلوسام برخلاف ماتریس‌های PAM برمبنای چینش‌های مشاهده شده محاسبه شده اند. ماتریس‌های بلوسام با اندیس بزرگتر برای مقایسه رشته‌هایی که شباهت بیشتری دارند استفاده می‌شوند.

منابع[ویرایش]

  1. ۱٫۰ ۱٫۱ Campbell NA; Reece JB; Meyers N; Urry LA; Cain ML; Wasserman SA; Minorsky PV; Jackson RB (2009). Biology: Australian Version (8th ed.). Pearson Education Australia. ISBN 978-1-4425-0221-5.
  2. ۲٫۰ ۲٫۱ Henikoff, S.; Henikoff, J.G. (1992). "Amino Acid Substitution Matrices from Protein Blocks". PNAS. 89 (22): 10915–10919. doi:10.1073/pnas.89.22.10915. PMC 50453. PMID 1438297.
  3. Altschul, SF (1991). "Amino acid substitution matrices from an information theoretic perspective". Journal of Molecular Biology. 219 (3): 555–65. doi:10.1016/0022-2836(91)90193-A.
  4. Dayhoff, M.O., Schwartz, R. and Orcutt, B.C. (1978). "A model of Evolutionary Change in Proteins". Atlas of protein sequence and structure (volume 5, supplement 3 ed.). Nat. Biomed. Res. Found. pp. 345–358. ISBN 978-0-912466-07-1.{{cite book}}: نگهداری یادکرد:نام‌های متعدد:فهرست نویسندگان (link)
  5. Pevsner J (2009). "Pairwise Sequence Alignment". Bioinformatics and Functional Genomics (2nd ed.). Wiley-Blackwell. pp. 58–68. ISBN 978-0-470-08585-1.
  6. Wing-Kin Sung (2010). Algorithms in Bioinformatics: A Practical Introduction. CRC Press. pp. 51–52. ISBN 978-1-4200-7033-0.