کانتیگ

از ویکی‌پدیا، دانشنامهٔ آزاد

وربست یا کانتیگ (به انگلیسی: Contig) قطعات پیوسته‌ای از توالی دی ان ای است که توسط بازسازی توالی خوانده‌های یک کروموزوم تولید می‌شود. در اصل کانتیگ به مانند نقشه ای از دی ان ای کروموزوم است که که نقاطی که قطعات پیوسته با هم همپوشانی دارند را مشخص می‌کند. به‌طور کلی در یک کانتیگ از توالی نوکلئوتایدهای به دست آمده اطمینان داریم.

تعریف[ویرایش]

از آن جایی که دی ان ای یک کروموزوم مولکولی طویل است لازم است برای توالی یابی و مطالعه آن، دی ان ای را به قطعات کوچکتر تقسیم کنیم، سپس توالی قسمت‌های کوچکتر، خوانده (به انگلیسی: read) را بخوانیم و از کنار هم قرار دادن آن‌ها با توجه به همپوشانی‌هایی که دارند، توالی دی ان ای اولیه را بیابیم. وربست یا کانتیگ مجموعه ای است از خوانده‌هایی، یا قطعاتی طولانی‌تر از خوانده‌ها، از دی ان ای که با هم همپوشانی داشته و در کنار یکدیگر یک توالی مشترک از دی ان ای را می‌سازند.[۱]

در توالی یابی پایین به بالا کانتیگ به مجموعه ای از قطعات همپوشان در توالی داده گفته می‌شود.[۲] در توالی بالا به پایین کانتیگ به کلونهای همپوشانی که یک نگاشت از ژن را برای هدایت توالی و بازسازی توالی تشکیل می‌دهند، اطلاق می‌شود.[۳] هر چند در سال‌های اخیر در مقالات مختلف، تعاریف متفاوت و گاهی ناهماهنگ با هم بیان شده،[۴] در این‌جا به بررسی دو تعریف گفته شده در بالا پرداخته می‌شود.

تعریف اولیه کانتیگ[ویرایش]

در سال ۱۹۸۰ «استادن»[۵] بیان کرد: "برای اینکه صحبت دربارهٔ داده به دست آمده از تفنگ ساچمه ای را آسان کنیم کلمه "کانتیگ" را ابداع کردیم. یک کانتیگ مجموعه ای ژل‌های خوانده شده‌است که با یکدیگر همپوشانی دارند. تمامی خواندن ژل‌ها به فقط و فقط یک کانتیگ تعلق دارند و هر کانتیگ حداقل شامل یک ژل خوانده شده‌است. مجموعه این خوانده‌ها در یک گانتیگ می‌تواند یک توالی مشترک ساخته که طول آن برابر با طول کانتیگ است."

توالی گانتیگ‌ها[ویرایش]

یک توالی کانتیگ یک توالی مداوم است که از بازسازی قطعات کوچک دی ان ای توسط توالی یابی پایین به بالا به حاصل می‌شوند. این تعریف از کانتیگ با تعریف اولیه «راجر استادن» (۱۹۷۹) مطابقت دارد.[۶]توالی یابی پایین به بالا شامل برش دادن ژنوم دی ان ای به قطعات کوچک‌تر ("خوانده")، توالی یابی این قطعات، بازسازی آن‌ها به کانتیگ و در نهایت به طول کل ژنوم است. از آن جا که فناوری‌های اخیر به ما تنها امکان توالی یابی از روی قطعات کوتاه دی ان ای (به طول ۳۰۰ تا ۱۰۰۰ نوکلئوتاید) را می‌دهند، لازم است که قبل از توالی یابی ژنوم به قطعات کوچک تقسیم شود.[۷] در توالی یابی بالا به پایین، دی ان ای تقویت شده به صورت تصادفی به قطعاتی به طول مناسب برای توالی یابی برش داده می‌شود. خوانده‌های دنباله دنباله، که توالی قطعات کوچک را شامل می‌شوند، در یک پایگاه داده درج می‌شوند. سپس نرم‌افزار توالی یابی[۷] در پایگاه داده به دنبال جفت‌های همپوشان می‌گردد. توالی یابی یه صورت جفت جفت باعث تولید شدن کانتیگ‌های طولانی تری از دی ان ای می‌شود. با چندین بار تکرار این مرحله، که در ابتدا شامل قطعات کوتاه‌تر و به مرور زمان شامل قطعات طولانی‌تر است، توالی کامل دی ای ان یک کروموزوم قابل تشخیص می‌شود.

مراحل تولید یک کانتیگ در روش تفنگ ساچمه ای.
مراحل تولید یک کانتیگ در روش تفنگ ساچمه ای.

امروزه متداول است که از فناوری‌های زوج-انتهایی استفاده شود که دو انتها یک قطعه طولانی‌تر با یک سایز مشخص توالی یابی می‌شوند. در اینجا، کانتیگ به هر قطعه پیوسته از دادهٔ توالی یابی که توسط همپوشانی خوانده‌ها تولید شود، گفته می‌شود. چون طول قطعات دی ان ای را می‌دانیم، فاصله بین دو انتها در یک قطعه نیز مشخص است.[۸] در این صورت اطلاعاتی در مورد جهت دهی کانتیگ‌ها داریم که با داشتن آن‌ها می‌توان توالی اسکافلدها را بازسازی کرد. هدف اصلی روش تفنگ ساچمه بیان توالی دی ان ای در تنها یک اسکافلد است، اما این هدف همیشه ممکن نیست زیرا بسته به خوانده‌های به دست آمده، دقت حاصل از توالی یابی می‌تواند متفاوت باشد.

اسکافلد[ویرایش]

اسکافلدها از کانتیگ‌هایی که با فاصله‌هایی با طول مشخص از هم جدا شده‌اند، تشکیل می‌شوند. محدودیت‌های جدیدی که بر روی جهت‌گیری کانتیگ‌ها وجود دارد، امکان قرار دادن توالی‌های تکراری در ژنوم را فراهم می‌کند. اگر یک انتها دارای یک توالی تکراری باشد، تا زمانی که جفت آن درون یک کانتیگ وجود دارد، مکان آن مشخص است.[۸] فاصله‌های باقی مانده بین کانتیگ‌ها در اسکافلدها را می‌توان با روش‌های گوناگونی، شامل روش تقویتی پی سی آر (برای توالی‌های کوتاه‌تر) و روش کلون بندی کروموزم مصنوعی باکتریایی، توالی یابی کرد.[۲]

خوانده‌های همپوشان از یک توالی زوج-انتهایی کانتیگ‌ها را می‌سازند. کانتیگ‌ها و فواصل بینشان اسکافلدها را می‌سازند.
خوانده‌های همپوشان از یک توالی زوج-انتهایی کانتیگ‌ها را می‌سازند. کانتیگ‌ها و فواصل بینشان اسکافلدها را می‌سازند.

کانتیگ‌های روش کروموزوم مصنوعی باکتریایی[ویرایش]

کانتیگ‌ها همچنین به کلون‌های همپوشان در نگاشت یک کروموزوم باکتریایی در روش‌های بالا به پایین یا سلسله مراتبی اطلاق می‌شوند.[۱] در این روش، یک نقشه با وضوح پایین قبل از توالی یابی ساخته می‌شود تا چارچوبی برای هدایت بازسازی توالی ژنوم فراهم شود. این نقشه مکان‌های به هم مرتبط و همپوشانی کلون‌های یک توالی را مشخص می‌کند. مجموعهٔ کلون‌های همپوشان که یک قطعه پیوسته از دی ان ای را می‌سازند، کانتیگ نام دارند.[۹] حداقل تعداد کلون‌ها برای تشکیل یک کانتیگ که توالی کل یک کروموزوم را تشکیل دهد شامل مسیری از نوکلئوتایدهای توالی است. مادامی که یک مسیر انتخاب شود، مولفه‌های کروموزوم باکتریایی آن به قطعات کوچک‌تر برش داده شده و توالی یابی می‌شوند. در نتیجه کانتیگ‌ها چارچوب این توالی یابی سلسله مراتبی را فراهم می‌کنند.[۳] بازسازی یک نقشه کانتیگ شامل مراحل متعددی است. ابتدا، دی ان ای به (۵۰ تا ۲۰۰ هزار) قطعه که کلون‌ها را تشکیل می‌دهند، تقسیم می‌شوند. چون این کلون‌ها باید کل ژنوم یا کروموزم را شامل شوند، به صورت تئوری می‌توان یک کانتیگ را از کروموزوم‌های مصنوعی باکتریایی را که کل کروموزوم را می‌پوشاند، توالی یابی کرد.[۱] در واقعیت اما همچین اتفاقی نخواهد افتاد زیرا معمولاً فاصله‌ها باقی می‌مانند. همان‌طور که گفته شد این فواصل را می‌توان با روش‌های دیگر پوشاند.

ساخت کانتیگ‌های روش کروموزوم مصنوعی باکتریایی[ویرایش]

کانتیگ‌های کروموزوم مصنوعی باکتریایی از طریق سامان دهی مناطقی در کروموزوم که همپوشانی دارند به دست می‌آیند. یک روش متداول این است که از نقشه روش توالی-برچسب زده برای تشخیص قطعات یکتا دی ان ای در کروموزوم‌های مصنوعی باکتریایی مشترک استفاده کرد. درجه همپوشانی توسط تعداد نقاط نشان گذاری شده روش توالی-برچسب زده بین دو کلون به صورت تقریبی به دست می‌آید، به این صورت که هر چقدر تعداد این نقاط بیشتر باشد، درجه همپوشانی بیشتر است.[۲] چون این روش به صورت تقریبی عمل می‌کند، تجزیه و تحلیل قطعات که اندازه‌گیری دقیق تر همپوشانی کلون‌ها را فراهم می‌کند، اغلب مورد استفاده قرار می‌گیرد.[۲] در این استراتژی، کلون‌ها با یک یا دو آنزیم محدود کننده ترکیب و قطعات حاصل با الکتروفورز ژل جداسازی می‌شوند. از آنجایی که تعداد قطعه‌های مشترک و طول این قطعات شناخته شده‌است (طول آن با مقایسه با استاندارد اندازه‌گیری قضاوت می‌شود)، درجه همپوشانی می‌تواند با دقت بالایی محاسبه شود.

فواصل بین کانتیگ‌ها[ویرایش]

فواصل معمولاً بعد از تولید اولیه کروموزوم مصنوعی باکتریایی باقی می‌مانند. این فواصل زمانی رخ می‌دهند که کتابخانه کروموزم مصنوعی باکتریایی دارای پیچیدگی کمی باشد، به این معنی که تعداد کمی از توالی‌های برچسب زده و محل‌های محدود کننده وجود دارد یا بعضی نواحی کمتر در این کتابخانه کمتر حضور دارند.[۱] اگر فواصل بین کانتیگ‌ها پس از نقشه‌برداری روش توالی-برچسب زده و محدودسازی اثر آن‌ها باقی بمانند، توالی انتهای کانتیگ‌ها می‌توانند برای از بین بردن این فواصل مورد استفاده قرار بگیرند. این روش توالی یابی انتهایی، توالی‌های برچسب زدهٔ جدیدی را ایجاد می‌کند که با استفاده از آن، کانتیگ‌های دیگر نمایش داده می‌شوند.[۲]

پانویس[ویرایش]

  1. ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ Gregory, S. Contig Assembly. Encyclopedia of Life Sciences, 2005.
  2. ۲٫۰ ۲٫۱ ۲٫۲ ۲٫۳ ۲٫۴ Gibson, Greg; Muse, Spencer V. (2009). A Primer of Genome Science (3rd ed.). Sinauer Associates. p. 84. ISBN 978-0-87893-236-8.
  3. ۳٫۰ ۳٫۱ Dear, P. H. Genome Mapping. Encyclopedia of Life Sciences, 2005. doi:10.1038/npg.els.0005353.
  4. What is a Contig? Article in staden.org
  5. Staden, R (1980). "A new computer method for the storage and manipulation of DNA gel reading data" (PDF). Nucleic Acids Research. 8 (16): 3673–3694. doi:10.1093/nar/8.16.3673. PMC 324183. PMID 7433103. Retrieved June 7, 2017.
  6. Staden R (1979). "A strategy of DNA sequencing employing computer programs". Nucleic Acids Research. 6: 2601–2610. doi:10.1093/nar/6.7.2601. PMC 327874. PMID 461197.
  7. ۷٫۰ ۷٫۱ Dunham, I. Genome Sequencing. Encyclopedia of Life Sciences, 2005.
  8. ۸٫۰ ۸٫۱ Fullwood MJ, Wei C, Liu ET, et al. (2009). "Next-generation DNA sequencing of paired-end tags (PET) for transcriptome and genome analyses". Genome Research. 19 (4): 521–532. doi:10.1101/gr.074906.107. PMC 3807531. PMID 19339662.
  9. Coulson, A.R; Sulston, J.E; Brenner, S.; Karn, J. (1986). "Toward a physical map of the genome of the nematode Caenorhabditis elegans". Proc Natl Acad Sci U S A.

لینک‌های دیگر[ویرایش]