توالی‌یابی نسل سوم

از ویکی‌پدیا، دانشنامهٔ آزاد

توالی‌یابی نسل سوم که توالی‌یابی طویل-خوانش نیز نامیده می‌شود یک کلاس از روش‌های توالی‌یابی دی‌اِن‌اِی است که اخیراً تحت توسعهٔ فعال قرار گرفته‌است.[۱] توالی‌یابی نسل سوم با خوانش توالی‌های نوکلئوتیدی در سطح یک مولکول عمل می‌کند. برخلاف روش‌های موجود که نیازمند شکستن رشته‌های طویل دی‌اِن‌اِی به قطعات کوچک و سپس ایجاد توالی‌های نوکلئوتیدی به‌وسیلهٔ تکثیر و سنتز هستند.[۲] چالش‌های جدی در مهندسی ابزارهای مولکولی لازم برای توالی‌یابی کل ژنوم وجود دارد تا این فناوری از نظر تجاری در دسترس باشد.

توالی‌یابی نسل دوم (توالی‌یابی کوتاه-خوانش)، که اغلب به عنوان توالی‌یابی نسل بعدی (NGS) خوانده می‌شود، از زمان توسعه تاکنون بر فضای توالی‌یابی دی‌ان‌ای مسلط شده‌است. این روش به‌طرز چشمگیری هزینهٔ توالی‌یابی دی‌ان‌ای را با یک رویکرد موازی گسترده که قادر به تولید تعداد زیادی خوانش با پوشش وسیع از کل ژنوم است، کاهش داده‌است.[۳] از آنجا که ژنوم یوکاریوتی حاوی توالی‌های تکراری (دی‌اِن‌اِی) است، محدودیت عمدهٔ این کلاس از روش‌های توالی‌یابی، طول خوانش‌های تولید شده‌است. به‌طور خلاصه، توالی‌یابی نسل دوم با تکثیر مولکول دی‌اِن‌اِی و سپس انجام توالی‌یابی به‌واسطهٔ سنتز انجام می‌شود. سیگنال فلورسنت جمعی ناشی از سنتز تعداد زیادی از رشته‌های دی‌اِن‌اِی یکسان تکثیر شده، اجازهٔ استنباط هویت نوکلئوتیدی را می‌دهد. با این حال، به دلیل خطاهای تصادفی ، سنتز دی‌اِن‌اِی بین رشته‌های دی‌اِن‌اِی تکثیرشده به‌طور پیش‌رونده‌ای همزمان نیستند. به سرعت، با افزایش طول خوانش، کیفیت سیگنال بدتر می‌شود. به منظور حفظ کیفیت خوانش، مولکول‌های طویل دی‌اِن‌اِی باید به قطعات کوچک تقسیم شوند که این امر به محدودیت اساسی فناوری‌های توالی‌یابی نسل دوم منجر تلاش‌های محاسباتی با هدف غلبه بر این چالش اغلب به برآورد تقریبی تکیه دارد که ممکن است به مونتاژ دقیق توالی‌ها منجر نشود.

با قابلیت توالی‌یابی مستقیم مولکول‌های دی‌اِن‌اِی منفرد، فناوری‌های توالی‌یابی نسل سوم این توانایی را دارند که خوانشی به مراتب طویل‌تر از توالی‌یابی نسل دوم داشته باشند.[۱] چنین مزیتی هم برای علم ژنوم و هم به‌طور کلی در مورد زیست‌شناسی پیامدهای اساسی دارد. با این حال، داده‌های توالی‌یابی نسل سوم میزان خطای بسیار بالاتری نسبت به فناوری‌های قبلی دارند، که می‌تواند مونتاژ ژنوم پایین‌دست و تجزیه و تحلیل داده‌های حاصل را پیچیده کند.[۴] این فناوری‌ها به‌طور فعال در حال توسعه هستند و انتظار می‌رود میزان خطاهای آن‌ها کاهش یابد. برای برنامه‌های کاربردی که تحمل بیشتری نسبت به نرخ خطا دارند، مانند فراخوانی واریانت ساختاری، توالی‌یابی نسل سوم از روش‌های موجود بهتر عمل می‌کند.[۵]

فناوری‌های حاضر[ویرایش]

فناوری‌های توالی‌یابی با رویکرد متفاوت نسبت به پلتفرم‌های نسل دوم برای اولین بار در سال ۲۰۰۸–۲۰۰۹ به عنوان «نسل سوم» معرفی شدند.[۶]

در حال حاضر چندین شرکت در مرکز توسعه فناوری توالی‌یابی نسل سوم قرار دارند که عبارت‌اند از: Pacific Biosciences, Oxford Nanopore Technology, Quantapore (CA-USA) و Stratos (WA-USA). این شرکت‌ها برای توالی‌یابی مولکول‌های دی‌اِن‌اِی منفرد رویکردهای کاملاً متفاوتی دارند.

PacBio پلتفرم توالی‌یابی در زمان واقعی مولکول منفرد (SMRT) را بر اساس ویژگی‌های موجبرهای حالت صفر توسعه داد. سیگنال‌ها به شکل نور فلورسنت از هر نوکلئوتیدی که با دی‌اِن‌اِی پلیمراز متصل به کف چاهک zL ترکیب دی‌اِن‌اِی، انتشار می‌یابند.

فناوری آکسفورد نانوپور شامل عبور یک مولکول دی‌اِن‌اِی از ساختار منفذ با مقیاس نانو و سپس اندازه‌گیری تغییرات میدان الکتریکی اطراف منفذ است؛ در حالی که Quantapore یک رویکرد اختصاصی نانوپور دارد. Stratos Genomics با ورود پلیمری، بازهای دی‌اِن‌اِی را خارج می‌کند، "Xpandomers"، برای غلبه سیگنال بر سر و صدای خوانش مولکول‌های تک‌رشته‌ای دی‌اِن‌اِی نانوپور استفاده می‌شود.

همچنین رویکرد فلورسانس مولکول منفرد شرکت Helicos، قابل توجه است، اما این شرکت در پاییز سال ۲۰۱۵ ورشکسته شد.

مزایا[ویرایش]

مزیت بارز توالی‌یابی نسل سوم در مقایسه با نسل حاضر فناوری‌های توالی‌یابی، تولید خوانش‌های طویل‌تر است. انتظار می‌رود که این طول خوانش طولانی‌تر، چالش‌های محاسباتی متعددی پیرامون مونتاژ ژنوم، بازسازی رونوشت و متاژنومیکس را در میان دیگر زمینه‌های مهم پزشکی و زیست‌شناسی مدرن کاهش دهد.[۱]

واضح است که ژنوم‌های یوکاریوتی از جمله پریمات‌ها و انسان‌ها پیچیده هستند و تعداد زیادی مناطق طویل تکراری دارند. خوانش‌های کوتاه از توالی‌یابی نسل دوم باید به استراتژی‌های تقریبی متوسل شوند تا بتواند توالی‌های طولانی را برای مونتاژ و فراخوانی واریانت‌های ژنتیکی به‌دست آورند. برای غلبه بر این محدودیت‌ها، خوانش‌های دو طرفهٔ توالی‌یابی نسل دوم اعمال شده‌است. با این حال، طول دقیق قطعهٔ دو طرفه خوانده شده اغلب ناشناخته است و باید تخمین زده شود. مزایای فناوری‌های توالی‌یابی نسل سوم با ممکن ساختن خوانش‌های طویل واضح است.

اپی‌ژنتیک[ویرایش]

نشانگرهای اپی‌ژنتیکی تغییرات پایدار و بالقوهٔ ارثی در مولکول دی‌اِن‌اِی هستند که در توالی آن نیستند. یک مثال متیلاسیون دی‌اِن‌اِی در محل‌های CpG است که مشخص شده‌است بر بیان ژن تأثیر می‌گذارد. یک نمونه دیگر تغییرات هیستونی است. نسل حاضر فناوری‌های توالی‌یابی برای تشخیص نشانگرهای اپی‌ژنتیکی به روش‌های آزمایشگاهی مانند توالی‌یابی ChIP متکی هستند. این روش‌ها شامل برچسب زدن به رشتهٔ دی‌اِن‌اِی، شکستن و فیلتر کردن قطعاتی است که حاوی نشانگر هستند و به دنبال آن توالی‌یابی. توالی‌یابی نسل سوم ممکن است به دلیل سیگنال متمایز از چهار باز دیگر نوکلئوتیدی، شناسایی مستقیم این نشانگرها را ممکن سازد.[۷]

قابلیت حمل و سرعت[ویرایش]

از دیگر مزایای مهم فناوری‌های توالی‌یابی نسل سوم می‌توان به قابلیت حمل و سرعت توالی‌یابی اشاره نمود.[۸] از آنجا که حداقل پردازش نمونه در مقایسه با توالی‌یابی نسل دوم مورد نیاز است، امکان طراحی تجهیزات در اندازه کوچک وجود دارد. اخیراً شرکت Oxford Nanopore Technology دستگاه توالی‌یابی Minion را تجاری کرده‌است. این دستگاه توالی‌یابی تقریباً اندازه فلش مموری یواس‌بی معمولی است و با اتصال به لپ‌تاپ به راحتی قابل استفاده است. علاوه بر این، از آنجا که فرایند توالی‌یابی در مناطق ژنوم موازی نیست، داده‌ها را می‌توان در زمان واقعی جمع‌آوری و تجزیه و تحلیل کرد. این مزایای توالی‌یابی نسل سوم ممکن است در بیمارستان که نیازمند جمع‌آوری و تجزیه و تحلیل سریع داده‌ها است، مناسب باشد.

چالش‌ها[ویرایش]

توالی‌یابی نسل سوم، همان‌طور که در حال حاضر مواجه است، با چالش‌های مهمی که عمدتاً در شناسایی دقیق بازهای نوکلئوتیدی وجود دارد روبه‌رو است. نرخ خطا در مقایسه با توالی‌یابی نسل دوم هنوز بسیار بیشتر است.[۴] این امر به‌طور کلی به دلیل ناپایداری ماشین‌های مولکولی درگیر است. به عنوان مثال، در فناوری توالی‌یابی مولکولی منفرد و زمان واقعی PacBio، مولکول دی‌ان‌ای پلیمراز همان‌طور که روند توالی‌یابی انجام می‌شود، به‌طور فزاینده ای آسیب می‌بیند.[۴] علاوه بر این، از آنجا که این روند به سرعت اتفاق می‌افتد، ممکن است سیگنال‌هایی که توسط بازهای منفرد خاموش می‌شوند با سیگنال‌های بازهای همسایه محو شوند. این یک چالش محاسباتی جدید برای رمزگشایی سیگنال‌ها و در نتیجه استنباط توالی است. به عنوان مثال، بدین منظور روش‌هایی مانند مدل‌های مارکوف پنهان با موفقیت‌هایی به کار گرفته شده‌است.[۷] به‌طور متوسط، حدود ۹۹٫۹٪ از ژن‌های افراد مختلف جمعیت انسانی مشترک است. به عبارت دیگر، تقریباً از هر هزار باز فقط یک بازبین دو فرد متفاوت است. نرخ خطای بالای ناشی از توالی‌یابی نسل سوم به منظور تعیین تفاوت‌های فردی بین اعضای یک گونه، ناگزیر مشکل‌ساز است.

مونتاژ ژنوم[ویرایش]

مونتاژ ژنوم بازسازی توالی دی‌اِن‌اِی کل ژنوم است که به‌طور کلی با دو رویکرد کاملاً متفاوت انجام می‌شود.

ردیف‌سازی مرجع[ویرایش]

هنگامی که یک ژنوم مرجع در دسترس باشد، همان‌طور که در مورد انسان وجود دارد، خوانش‌های توالی تازه می‌توانند به منظور تعیین خصوصیات آن با ژنوم مرجع ردیف شوند. چنین مونتاژ مبتنی بر مرجع سریع و آسان است اما عیب آن «پنهان کردن» توالی‌های جدید و واریانت‌های تعداد نسخهٔ بزرگ است. علاوه بر این، ژنوم مرجع برای بیشتر جانداران هنوز وجود ندارد.

مونتاژ از نو[ویرایش]

مونتاژ از نو روش جایگزین مونتاژ ژنوم برای ردیف‌سازی مرجع است. این کاملاً به بازسازی توالی‌های کل ژنوم از خوانش‌های توالی خام بر می‌گردد. این روش زمانی انتخاب می‌شود که ژنوم مرجع وجود نداشته باشد، هنگامی که گونهٔ ارگانیسم مورد نظر ناشناخته باشد مثل متاژنومیکس، یا هنگامی که واریانت‌های ژنتیکی مورد نظر با ردیف‌سازی ژنوم مرجع تشخیص داده نمی‌شوند.

با توجه به خوانش‌های کوتاه تولید شده توسط نسل حاضر فناوری‌های توالی‌یابی، مونتاژ از نو یک مشکل بزرگ محاسباتی است. به‌طور معمول با یک روند تکرار شونده برای یافتن و اتصال خوانش‌های توالی با همپوشانی معقول خوانده می‌شود، نزدیک می‌شوید. روش‌های مختلف محاسباتی و آماری مانند نمودارهای de bruijn و نمودارهای مورد توافق طرح همپوشان، برای حل این مشکل به کار گرفته شده‌است. با این وجود، با توجه به ماهیت بسیار تکراری ژنوم یوکاریوتی، بازسازی دقیق و کامل توالی ژنوم در مونتاژ از نو چالش‌برانگیز است. خوانش‌های دو طرفه به عنوان یک راه حل ممکن مطرح شده‌است، اگرچه طول قطعه دقیقاً شناخته شده نیست و باید تقریبی محاسبه شود.[۹]

مونتاژ دورگه - استفاده از خوانش‌های موجود در پلتفرم توالی‌یابی نسل سوم با خوانش‌های کوتاه پلتفرم نسل دوم - ممکن است برای رفع ابهامات در ژنوم‌هایی که قبلاً با استفاده از توالی‌یابی نسل دوم مونتاژ شده‌اند، استفاده شود. از خوانش‌های کوتاه نسل دوم نیز برای اصلاح خطاهایی که در خوانش‌های طویل نسل سوم وجود دارد، استفاده می‌گردد.

مونتاژ دورگه[ویرایش]

خوانش طویل که توسط توالی‌یابی نسل سوم ارائه شده‌است، می‌تواند بسیاری از چالش‌های کنونی که مونتاژ ژنومی از نو با آن مواجه می‌شود را کاهش دهد. به عنوان مثال، اگر کل یک منطقهٔ تکراری بتواند به‌طور واضح در یک خوانش توالی‌یابی شود، هیچ نتیجه‌گیری محاسبه‌ای دیگری لازم نیست. روش‌های محاسباتی برای کاهش میزان خطای بالا پیشنهاد شده‌اند. به عنوان مثال، در یک مطالعه، نشان داده شد که مونتاژ از نو ژنوم میکروبی با استفاده از توالی‌یابی PacBio به تنهایی عملکرد برتری از توالی‌یابی نسل دوم دارد.[۱۰]

توالی‌یایی نسل سوم ممکن است همچنین همراه با توالی‌یابی نسل دوم نیز استفاده شود. به این روش اغلب با عنوان توالی‌یابی دورگه اشاره می‌شود. به عنوان مثال، خوانش‌های طویل از توالی‌یابی نسل سوم ممکن است برای رفع ابهامات در ژنوم‌هایی که قبلاً با استفاده از توالی‌یابی نسل دوم مونتاژ شده‌اند، استفاده گردد. از طرف دیگر، خوانش‌های توالی‌یابی نسل دوم کوتاه، برای اصلاح خطاهای موجود در خوانش‌های طویل نسل سوم استفاده شده‌است. به‌طور کلی، این رویکرد دورگه به‌طور قابل توجهی موجب بهبود مونتاژ ژنوم از نو می‌شود.[۱۱]

نشانگرهای اپی‌ژنتیکی[ویرایش]

متیلاسیون دی‌اِن‌اِی (DNAm)-تغییر کووالانسی دی‌اِن‌اِی در محل‌های CpG که منجر به اتصال گروه‌های متیل می‌شود - بهترین جزء قابل درک ماشین اپی‌ژنتیک است. تغییرات دی‌اِن‌اِی و بیان ژن ناشی از آن می‌تواند در انواع سلول‌ها متفاوت باشد. دورهٔ تکوین، با دودمان ژنتیکی، به دلیل محرک‌های محیطی می‌تواند تغییر کند و قابل توارث هستند. محققان پس از کشف DNAm، همبستگی آن را با بیماری‌هایی مانند سرطان و اوتیسم نیز پیدا کردند.[۱۲] در سبب‌شناسی این بیماری‌ها بستر DNAm یک راه مهم برای تحقیقات بیشتر است.

مزایا[ویرایش]

متداول‌ترین روش‌های حاضر برای بررسی وضعیت متیلاسیون نیازمند سنجش قطعات دی‌اِن‌اِی قبل از توالی‌یابی نسل دوم استاندارد، بر روی پلت فرم Illumina می‌باشد. در نتیجه خوانش کوتاه، اطلاعات مربوط به الگوهای طولانی‌تر متیلاسیون از بین می‌رود.[۷] فناوری‌های توالی‌یابی نسل سوم، قابلیت توالی‌یابی مولکول‌های منفرد در زمان واقعی را از خوانش‌های طویل‌تر و شناسایی تغییرات دی‌اِن‌اِی بدون سنجش‌هایی که ذکر شد را ارائه می‌دهد.[۱۳]

فناوری PacBio SMRT و Oxford Nanopore می‌توانند از دی‌اِن‌اِی تغییر نیافته برای تشخیص متیلاسیون استفاده کنند. دستگاه MinION شرکت Oxford Nanopore Technologgies برای تشخیص DNAm استفاده شده‌است. از آنجا که هر رشته دی‌اِن‌اِی از یک منفذ عبور می‌کند، سیگنال‌های الکتریکی تولید می‌کند که مشخص شده به تغییرات اپی‌ژنتیکی موجود در نوکلئوتیدها حساس هستند و از یک مدل مارکوف پنهان (HMM) برای تجزیه و تحلیل داده‌های MinION برای شناسایی تغییرات ۵-متیل سیتوزین (5mC) دی‌اِن‌اِی استفاده شده‌است.[۷] این مدل با استفاده از دی‌اِن‌اِی متیله‌شدهٔ اشریشیا کلی که به‌صورت مصنوعی سنتز شده و سیگنال‌های حاصل از آن که با استفاده از فناوری نانوپور اندازه‌گیری شده‌است، ارائه داده‌است. پس از آن، مدل برای تشخیص ۵- متیل سیتوزین در خوانش‌های ژنومیک MinION حاصل از یک رده سلولی انسانی که قبلاً یک متیلوم مرجع داشت، استفاده شد. طبقه‌بندی کننده دارای دقت ۸۲٪ در محل‌های تک‌نمونه‌ای تصادفی است، هنگامی که از حد آستانه‌های سخت‌گیرانه استفاده شود تا ۹۵٪ افزایش می‌یابد.[۷]

روش‌های دیگر، انواع مختلفی از تغییرات دی‌اِن‌اِی را با استفاده از پلتفرم MinION ارائه می‌دهند. استویبر و همکاران ۴-متیل سیتوزین (4-mC) و ۶-متیل آدنین (6mA) را به همراه ۵-متیل سیتوزین (5mC) مورد بررسی قرار دادند، و همچنین یک نرم‌افزار ایجاد کردند تا مستقیماً داده‌های خام MinION را به روش آسانی بصری کند.[۱۴] در اینجا آن‌ها دریافتند که در اشریشیا کلی، که دارای متیلوم شناخته شده‌است، می‌توان از پنجره‌های رویداد به طول ۵ جفت‌باز برای تقسیم و تجزیه و تحلیل آماری سیگنال‌های الکتریکی خام MinION استفاده نمود. یک آزمون ساده Mann-Whitney U test می‌تواند بخش‌های تغییر یافته از توالی اشریشیا کلی را تشخیص دهد، و همچنین تغییرات را به مناطق 4mC، 6mA یا 5mC تقسیم کند.[۱۴]

به نظر می‌رسد در آینده از داده‌های خام MinION برای تشخیص بسیاری از علائم گوناگون اپی‌ژنتیکی در دی‌اِن‌اِی استفاده شود.

برای تعیین متیلاسیون دی‌اِن‌اِی از توالی‌یابی PacBio نیز استفاده شده‌است. در این پلت فرم گستره پالس - گسترهٔ یک پالس نور فلورسنت - به یک باز خاص مربوط می‌شود. در سال ۲۰۱۰ نشان داده شد که فاصلهٔ بینابینی در نمونه‌های شاهد و متیله‌شده متفاوت است و برای هر نوع متیلاسیون یک گسترهٔ پالس «منحصر به فرد» وجود دارد.[۱۳] در سال ۲۰۱۲ با استفاده از پلتفرم PacBio، محل‌های اتصال دی‌اِن‌اِی متیل ترانسفرازها مشخص شد.[۱۵] شناسایی متیلاسیون N6 در کرم الگانس (C.elegans) در سال ۲۰۱۵ نشان داده شد.[۱۶] متیلاسیون دی‌اِن‌اِی روی N6-adenine با استفاده از پلتفرم PacBio در سلول‌های بنیادی جنینی موش در سال ۲۰۱۶ نشان داده شد.[۱۷]

اشکال دیگری از تغییرات دی‌اِن‌اِی -ناشی از فلزات سنگین، اکسیداسیون یا آسیب با پرتو فرابنفش - نیز راه‌های تحقیقاتی هستند که با استفاده از توالی‌یابی نسل سوم Oxford Nanopore و PacBio امکان‌پذیر هستند.

معایب[ویرایش]

پردازش داده‌های خام - مانند نرمال‌سازی با سیگنال میانگین - بر روی داده‌های خام MinION نیاز بود و باعث کاهش توانایی در زمان واقعی فناوری می‌شد.[۱۴] پایداری سیگنال‌های الکتریکی هنوز یک معضل است و فراخوانی دقیق نوکلئوتید را دشوار می‌کند. MinION توان عملیاتی کمی دارد؛ از آنجا که خوانش‌های هم‌پوشان متعدد بسیار دشوار به‌دست می‌آیند، این خوانش‌های بیشتر، منجر به رفع مشکلات شناسایی تغییرات پایین‌دست دی‌اِن‌اِی می‌شود. هم مدل مارکوف پنهان و هم روش‌های آماری که از داده‌های خام MinION استفاده نموده‌است نیازمند مشاهدات مکرر از تغییرات دی‌اِن‌اِی برای تشخیص است، به این معنی که نوکلئوتیدهای تغییر یافتهٔ منفرد باید به‌طور مداوم در چندین نسخه از ژنوم حضور داشته باشند، به عنوان مثال در چندین سلول یا پلاسمید موجود در نمونه.

برای پلتفرم PacBio نیز بسته به نوع متیلاسیون دلخواه، نیازهای پوشش متفاوت است. تا مارس ۲۰۱۷، سایر عوامل اپی‌ژنتیکی مانند تغییرات هیستونی با استفاده از فناوری‌های نسل سوم قابل کشف نبودند. الگوهای طویل متیلاسیون غالباً به‌علت این‌که هنوز نیاز به مونتاژ کانتیگ‌های کوچک‌تر است، از بین می‌روند.

ترانسکریپتومیکس[ویرایش]

ترانسکریپتومیکس به معنی مطالعهٔ ترانسکریپتوم است، معمولاً به‌عنوان فراوانی نسبی مولکول‌های آران‌ای پیام‌رسان بافت مورد مطالعه توصیف می‌شود. با توجه اصل بنیادین زیست‌شناسی مولکولی، اطلاعات ژنتیکی از مولکول‌های دی‌اِن‌اِی دورشته‌ای به مولکول‌های آران‌ای پیام‌رسان تک‌رشته‌ای جریان می‌یابند جایی که می‌توانند به آسانی به مولکول‌های پروتئین عملکردی ترجمه شوند.

با مطالعهٔ ترانسکریپتوم، می‌توان درک ارزشمندی در مورد تنظیم بیان ژن به‌دست‌آورد. در حالی که میزان بیان به عنوان میزان ژن می‌تواند کم و بیش به‌طور دقیق توسط توالی‌یابی نسل دوم به تصویر کشیده شود، اطلاعات میزان رونوشت هنوز یک چالش مهم است.[۱۸] در نتیجه، نقش پیرایش متناوب در زیست‌شناسی مولکولی تا حد زیادی مبهم است. فناوری‌های توالی‌یابی نسل سوم با توالی‌یابی کامل مولکول‌های آران‌ای پیام‌رسان، چشم‌انداز امیدوارکننده‌ای برای حل این مسئله دارند.

پیرایش متناوب[ویرایش]

پیرایش متناوب (AS) فرایندی است که با استفاده از آن یک ژن واحد می‌تواند چندین نسخهٔ متمایز آران‌ای پیام‌رسان و در نتیجه ترجمه‌های پروتئینی متفاوتی ایجاد کند.[۱۹] برخی شواهد نشان می‌دهد که پیرایش متناوب یک پدیدهٔ همه‌جایی است و ممکن است نقش مهمی در تعیین فنوتیپ‌های جانداران به‌ویژه در یوکاریوت‌های پیچیده ایفا کند. همهٔ یوکاریوت‌ها حاوی ژن‌هایی هستند که از اینترون‌ها تشکیل شده‌اند. به‌طور خاص، تخمین زده شده‌است که پیرایش متناوب در ۹۵٪ از کل ژن‌های چند اگزون انسانی رخ می‌دهد.[۲۰] پیرایش متناوب پتانسیل غیرقابل انکاری بر بسیاری از روندهای زیستی دارد. پیشرفت دانش در این زمینه به‌طور کلی پیامدهای اساسی برای مطالعهٔ زیست‌شناسی دارد.

بازسازی رونوشت[ویرایش]

نسل حاضر فناوری‌های توالی‌یابی فقط خوانش‌های کوتاه را تولید می‌کند، که محدودیت فوق‌العاده‌ای در توانایی تشخیص رونوشت‌های مجزا ایجاد می‌کند. خوانش‌های کوتاه باید با مهندسی معکوس به رونوشت‌های اصلی تبدیل شوند که می‌تواند منجر به مشاهدهٔ خوانش‌ها گردد.[۲۱] این وظیفه توسط میزان بیان بسیار متغیر در رونوشت‌ها و در نتیجه پوشش متغیر خوانش توالی ژن پیچیدگی بیشتری می‌یابد.[۲۱] علاوه بر این، اگزون‌ها ممکن است در میان رونوشت‌های خاصی به اشتراک گذاشته شوند، لذا تفسیر واضح اساساً غیرممکن است.[۱۹] روش‌های محاسباتی موجود، تفسیرها را بر اساس تجمع خوانش‌های کوتاه در توالی‌های مختلف[۲۱] بیشتر با ساختن فرضیات ساده انجام می‌دهد.

Cufflinks، یک رویکرد صرفه‌جویانه را در پیش می‌گیرد و در پی توضیح همه خوانش‌ها با کمترین تعداد ممکن از رونوشت‌ها است.[۲۲] از سوی دیگر، StringTie تلاش می‌کند تا ضمن جمع‌آوری خوانش‌ها، فراوانی رونوشت‌ها را هم برآورد کند.[۲۱] این روش‌ها، اگرچه منطقی هستند، همیشه رونوشت‌های واقعی را نمی‌توانند شناسایی کنند. مطالعه ای که در سال ۲۰۰۸ منتشر شد، ۲۵ پروتکل مختلف موجود در بازسازی رونوشت را مورد بررسی قرار داد.[۱۸] این شواهد نشان می‌دهد که روش‌های موجود معمولاً در مونتاژ رونوشت‌ها ضعیف هستند، اگرچه توانایی تشخیص اگزون‌های منفرد را به‌طور نسبتاً بی‌عیبی دارند.[۱۸] طبق برآوردها، میانگین حساسیت تشخیص اگزون‌ها در ۲۵ پروتکل برای ژن‌های کرم الگانس، ۸۰٪ است.[۱۸] در مقابل، حساسیت شناسایی رونوشت‌ها به ۶۵٪ کاهش می‌یابد. بر اساس نتایج این مطالعه در انسان، میانگین حساسیت تشخیص اگزون ۶۹٪ و میانگین حساسیت تشخیص رونوشت‌ها تنها ۳۳٪ است.[۱۸] به عبارت دیگر، برای انسان، روش‌های موجود قادر به شناسایی کمتر از نیمی از کل رونوشت‌های موجود هستند. فناوری‌های توالی‌یابی نسل سوم چشم‌انداز امیدوارکننده‌ای در حل مسئلهٔ تشخیص رونوشت و همچنین برآورد فراوانی آران‌ای پیام‌رسان در سطح رونوشت‌ها نشان داده‌است. در حالی که نرخ خطا همچنان بالاست، فناوری‌های توالی‌یابی نسل سوم این توانایی را دارند که طول خوانش بسیار بیشتری داشته باشند.[۲۳] شرکت Pacific Bioscience پلتفرم iso-seq را معرفی کرده‌است و ادعا می‌کند که مولکول‌های آران‌ای پیام‌رسان را در طول کاملشان توالی‌یابی می‌کند.[۲۳]

پیش‌بینی می‌شود شرکت Oxford Nanopore فناوری‌های مشابهی را ارائه دهد. مشکلی که در نرخ خطای بالاتر وجود دارد ممکن است با خوانش‌های کوتاه با کیفیت بالا کاهش یابد. این روش قبلاً آزمایش شده و گزارش شده‌است که میزان خطا را بیش از ۳ برابر کاهش می‌دهد.[۲۴]

متاژنومیکس[ویرایش]

متاژنومیکس آنالیز مواد ژنتیکی است که به‌طور مستقیم از نمونه‌های محیطی بازیابی می‌شود.

مزایا[ویرایش]

مهم‌ترین مزیت فناوری‌های توالی‌یابی نسل سوم در متاژنومیکس سرعت توالی‌یابی آن‌ها در مقایسه با روش‌های نسل دوم است. سرعت توالی‌یابی برای مثال در کلینیک (مانند شناسایی پاتوژن) از اهمیت زیادی برخوردار است، تا امکان تشخیص کارآمد و اقدامات بالینی به موقع فراهم شود. دستگاه Minion شرکت آکسفورد نانوپور در سال ۲۰۱۵ برای تشخیص متابوژنومیک در زمان واقعی پاتوژن‌ها در نمونه‌های بالینی پیچیده و پر خطر استفاده شد. اولین ویروس ابولا (EBV)، ۴۴ ثانیه پس از جمع‌آوری داده‌ها توالی‌یابی شد.[۲۵] در این‌جا نقشه‌خوانی یکنواخت برای خوانش‌های ژنوم وجود داشت. حداقل یک خوانش با بیش از ۸۸٪ ژنوم نقشه‌برداری شده مطابقت داشت. خوانش‌های نسبتاً طویل، توالی‌یابی تقریباً کامل ژنوم ویروسی را با دقت بالا (مطابقت ۹۷–۹۹٪) مستقیماً از یک نمونهٔ بالینی اولیه امکان‌پذیر می‌سازد.[۲۵] یک نشانگر فیلوژنتیک رایج برای مطالعات تنوع جامعهٔ میکروبی ژن آران‌ای ریبوزومی ۱۶اس است. پلتفرم‌های SMRT Minion و PacBio برای توالی‌یابی این ژن استفاده شده‌اند.[۲۶][۲۷] در این زمینه، میزان خطای PacBio قابل مقایسه با خوانش‌های کوتاه‌تر ۴۵۴ و پلتفرم دستگاه MiSeq شرکت Illumina است.[۲۸]

معایب[ویرایش]

میزان خطای بالای MinION (۱۰ تا ۴۰ درصد) از شناسایی نشانگرهای مقاومت ضدمیکروبی جلوگیری می‌کند، که بدین منظور تفکیک تک‌نوکلئوتیدی لازم است. به همین علت، پاتوژن‌های یوکاریوتی شناسایی نشده‌اند.[۲۵] همچنین سهولت انتقال آلودگی هنگام استفادهٔ مجدد از flow cell (دستورالعمل‌های شست‌وشوی استاندارد کار نمی‌کنند) نگران‌کننده است. بارکدهای منحصر به فرد ممکن است امکان تعدد آزمایش را فراهم کنند. علاوه بر این، انجام شناسایی دقیق گونه‌های باکتریایی، قارچ و انگل‌ها بسیار دشوار است، زیرا آن‌ها بخش بیشتری از ژنوم را به اشتراک می‌گذارند، برخی از آن‌ها تنها کمتر از ۵٪ تفاوت دارند.

هزینهٔ توالی‌یابی هر باز هنوز هم به‌طور قابل توجهی بیشتر از MiSeq است. با این حال، چشم‌انداز تکمیل پایگاه‌های داده‌های مرجع با توالی‌های کامل از جاندارانی که زیر حد تشخیص رویکرد سانگر هستند؛[۲۶] احتمالاً می‌تواند تا حد زیادی در شناسایی جانداران در متاژنومیکس کمک کند.

منابع[ویرایش]

  1. ۱٫۰ ۱٫۱ ۱٫۲ Bleidorn, Christoph (2016-01-02). "Third generation sequencing: technology and its potential impact on evolutionary biodiversity research". Systematics and Biodiversity (به انگلیسی). 14 (1): 1–8. doi:10.1080/14772000.2015.1099575. ISSN 1477-2000.
  2. Illumina sequencing technology (PDF)
  3. Treangen, Todd J.; Salzberg, Steven L. (Winter 2012). "Repetitive DNA and next-generation sequencing: computational challenges and solutions". Nature Reviews Genetics (به انگلیسی). 13 (1): 36–46. doi:10.1038/nrg3117. ISSN 1471-0056.
  4. ۴٫۰ ۴٫۱ ۴٫۲ Gupta, Pushpendra K. (Fall 2008). "Single-molecule DNA sequencing technologies for future genomics research". Trends in Biotechnology (به انگلیسی). 26 (11): 602–611. doi:10.1016/j.tibtech.2008.07.003.
  5. Greninger, Alexander L.; Naccache, Samia N.; Federman, Scot; Yu, Guixia; Mbala, Placide; Bres, Vanessa; Stryke, Doug; Bouquet, Jerome; Somasekar, Sneha (2015-01-01). "Rapid metagenomic identification of viral pathogens in clinical samples by real-time nanopore sequencing analysis". Genome Medicine. 7: 99. doi:10.1186/s13073-015-0220-9. ISSN 1756-994X. PMC 4587849. PMID 26416663.
  6. Check Hayden, Erika (2009-02-06). "Genome sequencing: the third generation". Nature (به انگلیسی). doi:10.1038/news.2009.86. ISSN 0028-0836.
  7. ۷٫۰ ۷٫۱ ۷٫۲ ۷٫۳ ۷٫۴ Simpson, Jared T; Workman, Rachael; Zuzarte, P. C.; David, Matei; Dursi, L. J.; Timp, Winston (2016-04-04). "Detecting DNA Methylation using the Oxford Nanopore Technologies MinION sequencer" (به انگلیسی). doi:10.1101/047142. {{cite journal}}: Cite journal requires |journal= (help)
  8. Schadt, E. E.; Turner, S.; Kasarskis, A. (2010-10-15). "A window into third-generation sequencing". Human Molecular Genetics (به انگلیسی). 19 (R2): R227–R240. doi:10.1093/hmg/ddq416. ISSN 0964-6906.
  9. Li, Ruiqiang; Zhu, Hongmei; Ruan, Jue; Qian, Wubin; Fang, Xiaodong; Shi, Zhongbin; Li, Yingrui; Li, Shengting; Shan, Gao (Winter 2010). "De novo assembly of human genomes with massively parallel short read sequencing". Genome Research (به انگلیسی). 20 (2): 265–272. doi:10.1101/gr.097261.109. ISSN 1088-9051. PMC 2813482. PMID 20019144.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  10. Chin, Chen-Shan; Alexander, David H; Marks, Patrick; Klammer, Aaron A; Drake, James; Heiner, Cheryl; Clum, Alicia; Copeland, Alex; Huddleston, John (Spring 2013). "Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data". Nature Methods (به انگلیسی). 10 (6): 563–569. doi:10.1038/nmeth.2474. ISSN 1548-7091.
  11. Fraser, Hunter B; Lam, Lucia L; Neumann, Sarah M; Kobor, Michael S (2012). "Population-specificity of human DNA methylation". Genome Biology. 13 (2): R8. doi:10.1186/gb-2012-13-2-r8. ISSN 1465-6906.
  12. Fraser, Hunter B; Lam, Lucia L; Neumann, Sarah M; Kobor, Michael S (2012). "Population-specificity of human DNA methylation". Genome Biology (به انگلیسی). 13 (2): R8. doi:10.1186/gb-2012-13-2-r8. ISSN 1465-6906. PMC 3334571. PMID 22322129.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  13. ۱۳٫۰ ۱۳٫۱ Flusberg, Benjamin A; Webster, Dale R; Lee, Jessica H; Travers, Kevin J; Olivares, Eric C; Clark, Tyson A; Korlach, Jonas; Turner, Stephen W (Spring 2010). "Direct detection of DNA methylation during single-molecule, real-time sequencing". Nature Methods (به انگلیسی). 7 (6): 461–465. doi:10.1038/nmeth.1459. ISSN 1548-7091. PMC 2879396. PMID 20453866.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  14. ۱۴٫۰ ۱۴٫۱ ۱۴٫۲ Stoiber, Marcus; Quick, Joshua; Egan, Rob; Eun Lee, Ji; Celniker, Susan; Neely, Robert K.; Loman, Nicholas; Pennacchio, Len A; Brown, James (2016-12-15). "De novo Identification of DNA Modifications Enabled by Genome-Guided Nanopore Signal Processing" (به انگلیسی). doi:10.1101/094672. {{cite journal}}: Cite journal requires |journal= (help)
  15. Clark, Tyson A.; Murray, Iain A.; Morgan, Richard D.; Kislyuk, Andrey O.; Spittle, Kristi E.; Boitano, Matthew; Fomenkov, Alexey; Roberts, Richard J.; Korlach, Jonas (2012-02-01). "Characterization of DNA methyltransferase specificities using single-molecule, real-time DNA sequencing". Nucleic Acids Research (به انگلیسی). 40 (4): e29–e29. doi:10.1093/nar/gkr1146. ISSN 1362-4962. PMC 3287169. PMID 22156058.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  16. Greer, EricLieberman; Blanco, MarioAndres; Gu, Lei; Sendinc, Erdem; Liu, Jianzhao; Aristizábal-Corrales, David; Hsu, Chih-Hung; Aravind, L.; He, Chuan (Spring 2015). "DNA Methylation on N6-Adenine in C. elegans". Cell (به انگلیسی). 161 (4): 868–878. doi:10.1016/j.cell.2015.04.005. PMC 4427530. PMID 25936839.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  17. Wu, Tao P.; Wang, Tao; Seetin, Matthew G.; Lai, Yongquan; Zhu, Shijia; Lin, Kaixuan; Liu, Yifei; Byrum, Stephanie D.; Mackintosh, Samuel G. (2016-04-21). "DNA methylation on N6-adenine in mammalian embryonic stem cells". Nature (به انگلیسی). 532 (7599): 329–333. doi:10.1038/nature17640. ISSN 0028-0836. PMC 4977844. PMID 27027282.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  18. ۱۸٫۰ ۱۸٫۱ ۱۸٫۲ ۱۸٫۳ ۱۸٫۴ The RGASP Consortium; Steijger, Tamara; Abril, Josep F; Engström, Pär G; Kokocinski, Felix; Hubbard, Tim J; Guigó, Roderic; Harrow, Jennifer; Bertone, Paul (Fall 2013). "Assessment of transcript reconstruction methods for RNA-seq". Nature Methods (به انگلیسی). 10 (12): 1177–1184. doi:10.1038/nmeth.2714. ISSN 1548-7091. PMC 3851240. PMID 24185837.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  19. ۱۹٫۰ ۱۹٫۱ Graveley, Brenton R. (Winter 2001). "Alternative splicing: increasing diversity in the proteomic world". Trends in Genetics (به انگلیسی). 17 (2): 100–107. doi:10.1016/S0168-9525(00)02176-4.
  20. Pan, Qun; Shai, Ofer; Lee, Leo J; Frey, Brendan J; Blencowe, Benjamin J (Fall 2018). "Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing". Nature Genetics (به انگلیسی). 40 (12): 1413–1415. doi:10.1038/ng.259. ISSN 1061-4036.
  21. ۲۱٫۰ ۲۱٫۱ ۲۱٫۲ ۲۱٫۳ Pertea, Mihaela; Pertea, Geo M; Antonescu, Corina M; Chang, Tsung-Cheng; Mendell, Joshua T; Salzberg, Steven L (Winter 2015). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads". Nature Biotechnology (به انگلیسی). 33 (3): 290–295. doi:10.1038/nbt.3122. ISSN 1087-0156. PMC 4643835. PMID 25690850.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  22. Trapnell, Cole; Williams, Brian A; Pertea, Geo; Mortazavi, Ali; Kwan, Gordon; van Baren, Marijke J; Salzberg, Steven L; Wold, Barbara J; Pachter, Lior (Spring 2010). "Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation". Nature Biotechnology (به انگلیسی). 28 (5): 511–515. doi:10.1038/nbt.1621. ISSN 1087-0156.
  23. ۲۳٫۰ ۲۳٫۱ Abdel-Ghany, Salah E.; Hamilton, Michael; Jacobi, Jennifer L.; Ngam, Peter; Devitt, Nicholas; Schilkey, Faye; Ben-Hur, Asa; Reddy, Anireddy S. N. (2016-06-24). "A survey of the sorghum transcriptome using single-molecule long reads". Nature Communications (به انگلیسی). 7 (1). doi:10.1038/ncomms11706. ISSN 2041-1723. PMC 4931028. PMID 27339290.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  24. Au, Kin Fai; Underwood, Jason G.; Lee, Lawrence; Wong, Wing Hung (2012-10-04). Xing, Yi (ed.). "Improving PacBio Long Read Accuracy by Short Read Alignment". PLoS ONE (به انگلیسی). 7 (10): e46679. doi:10.1371/journal.pone.0046679. ISSN 1932-6203.
  25. ۲۵٫۰ ۲۵٫۱ ۲۵٫۲ Greninger, Alexander L.; Naccache, Samia N.; Federman, Scot; Yu, Guixia; Mbala, Placide; Bres, Vanessa; Stryke, Doug; Bouquet, Jerome; Somasekar, Sneha (Fall 2015). "Rapid metagenomic identification of viral pathogens in clinical samples by real-time nanopore sequencing analysis". Genome Medicine (به انگلیسی). 7 (1). doi:10.1186/s13073-015-0220-9. ISSN 1756-994X. PMC 4587849. PMID 26416663.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  26. ۲۶٫۰ ۲۶٫۱ Benítez-Páez, Alfonso; Portune, Kevin J.; Sanz, Yolanda (Fall 2016). "Species-level resolution of 16S rRNA gene amplicons sequenced through the MinION™ portable nanopore sequencer". GigaScience (به انگلیسی). 5 (1). doi:10.1186/s13742-016-0111-z. ISSN 2047-217X. PMC 4730766. PMID 26823973.{{cite journal}}: نگهداری یادکرد:فرمت پارامتر PMC (link)
  27. Benítez-Páez, Alfonso; Portune, Kevin J.; Sanz, Yolanda (Fall 2016). "Species-level resolution of 16S rRNA gene amplicons sequenced through the MinION™ portable nanopore sequencer". GigaScience (به انگلیسی). 5 (1). doi:10.1186/s13742-016-0111-z. ISSN 2047-217X.
  28. خطای اسکریپتی: پودمان «citation/CS1» وجود ندارد.