جریمه پرش

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

از جریمه‌های پرش برای تطابق توالی (sequence alignment) استفاده می‌شود. جریمه‌های پرش به محاسبۀ کلی امتیاز تطابق‌ها کمک می‌کنند، و بنابراین، نسبت اندازۀ جریمۀ پرش به تعداد درایه‌های ماتریس شباهت (similarity matrix) تطابقی که نهایتاً انتخاب می‌شود را تحت تاثیر قرار می‌دهد.

جریمۀ پرش ثابت (Constant gap penalty)[ویرایش]

جریمۀ پرش ثابت از ساده ترین مدل‌های جریمۀ پرش است. در این روش زمانی که یک پرش برای اولین بار در توالی به کار گرفته می‌شود فقط یک پارامتر d، به امتیاز تطابق اضافه می‌شود و این بدین معناست که هر پرش یک جریمۀ یکسان دریافت می‌کند، مستقل از اینکه این پرش دارای چه اندازه ایست.

جریمۀ پرش خطی (Linear gap penalty)[ویرایش]

جریمۀ پرش خطی فقط یک پارامترِ d دارد که معرف جریمه در واحد طول پرش است. این مقدار در اکثر مواقع مقداری منفی است، بنابراین تطابق با تعداد پرش‌های کمتر بهتر است از تطابق با پرش‌های بیشتر. در روش جریمۀ پرش خطی، جریمۀ کلی برای یک پرش بزرگ همانند جریمۀ کلی برای چندین پرش کوچک است.

جریمۀ پرش نسبی (Affine gap penalty)[ویرایش]

در برخی توالی‌ها بیشتر این احتمال وجود دارد که یک پرش بزرگ داشته باشیم به جای چندین پرش کوچک. برای مثال، در یک توالی بایولوژیکی داشتن یک پرش بزرگ از اندازۀ ۱۰، به سبب انجام یک عمل insertion یا حذف، محتمل تر است از اینکه ۱۰ پرش کوچک از اندازۀ ۱ داشته باشد. جریمۀ پرش نسبی از یک جریمۀ شروع پرش (gap opening penalty)،

مطالعات بیشتر[ویرایش]

  • Taylor WR، Munro RE (۱۹۹۷). "Multiple sequence threading: conditional gap placement". Fold Des ۲ (۴): S۳۳-۹.
  • Taylor WR (۱۹۹۶). "A non-local gap-penalty for profile alignment". Bull Math Biol ۵۸ (۱): ۱–۱۸. object identifier|doi:۱۰.۱۰۰۷/BF۰۲۴۵۸۲۷۹. Identifier|PMID ۸۸۱۹۷۵۱.
  • Vingron M، Waterman MS (۱۹۹۴). "Sequence alignment and penalty choice. Review of concepts، case studies and implications". J Mol Biol ۲۳۵ (۱): ۱–۱۲. object identifier|doi:۱۰.۱۰۱۶/S۰۰۲۲-۲۸۳۶(۰۵)۸۰۰۰۶-۳. PMID ۸۲۸۹۲۳۵]].
  • Panjukov VV (۱۹۹۳). "Finding steady alignments: similarity and distance". Comput Appl Biosci ۹ (۳): ۲۸۵–۹۰. Identifier|PMID ۸۳۲۴۶۲۹.
  • Alexandrov NN (۱۹۹۲). "Local multiple alignment by consensus matrix". Comput Appl Biosci ۸ (۴): ۳۳۹–۴۵. PMID ۱۴۹۸۶۸۹.
  • Hein J (۱۹۸۹). "A new method that simultaneously aligns and reconstructs ancestral sequences for any number of homologous sequences، when the phylogeny is given". Mol Biol Evol ۶ (۶): ۶۴۹–۶۸. Identifier|PMID ۲۴۸۸۴۷۷.
  • Henneke CM (۱۹۸۹). "A multiple sequence alignment algorithm for homologous proteins using secondary structure information and optionally keying alignments to functionally important sites". Comput Appl Biosci ۵ (۲): ۱۴۱–۵۰. Identifier|PMID ۲۷۵۱۷۶۴.
  • Reich JG، Drabsch H، Daumler A (۱۹۸۴). "On the statistical assessment of similarities in DNA sequences". Nucleic Acids Res ۱۲ (۱۳): ۵۵۲۹–۴۳. object identifier|doi:۱۰.۱۰۹۳/nar/۱۲.۱۳.۵۵۲۹. PMC ۳۱۸۹۳۷. PMID ۶۴۶۲۹۱۴.