توالی یابی نسل سوم

از ویکی‌پدیا، دانشنامهٔ آزاد

توالی یابی نسل سوم(که توالی یابی طویل-خوانش نیز نامیده می‌شود) یک کلاس از روش‌های توالی یابی DNA می‌باشد که اخیراً تحت توسعه فعال قرار گرفته‌است.[۱] توالی یابی نسل سوم با خوانش توالی‌های نوکلئوتیدی در سطح یک مولکول عمل می‌کند، بر خلاف روش‌های موجود که نیازمند شکستن رشته‌های طویل DNA به قطعات کوچک و سپس ایجاد توالی‌های نوکلئوتیدی بوسیله تکثیر و سنتز هستند. [۲] چالش‌های جدی در مهندسی ابزارهای مولکولی لازم برای توالی یابی کل ژنوم وجود دارد تا این فناوری از نظر تجاری در دسترس باشد. توالی یابی نسل دوم (توالی یابی کوتاه-خوانش)، که اغلب به عنوان توالی یابی نسل بعدی (NGS) خوانده می‌شود، از زمان توسعه تاکنون بر فضای توالی یلبی DNA مسلط شده‌است. این روش به طرز چشمگیری هزینه توالی یابی DNA را با یک رویکرد موازی گسترده که قادر به تولید تعداد زیادی خوانش با پوشش وسیع از کل ژنوم است، کاهش داده‌است. [۳] از آنجا که ژنوم یوکاریوتی حاوی توالی‌های تکراری (DNA) است، محدودیت عمده این کلاس از روش‌های توالی یابی طول خوانش‌های تولید شده‌است. به‌طور خلاصه، توالی یابی نسل دوم با تکثیر مولکول DNA و سپس انجام توالی یابی بواسطه سنتز انجام می‌شود. سیگنال فلورسنت جمعی ناشی از سنتز تعداد زیادی از رشته‌های DNA یکسان تکثیر شده، اجازه استنباط هویت نوکلئوتیدی را می‌دهد. با این حال، به دلیل خطاهای تصادفی ، سنتز DNA بین رشته‌های DNA تکثیر شده به‌طور پیشرونده ای همزمان نمی‌باشند. به سرعت، با افزایش طول خوانش، کیفیت سیگنال بدتر می‌شود. به منظور حفظ کیفیت خوانش، مولکول‌های طویل DNA باید به قطعات کوچک تقسیم شوند که این امر به محدودیت اساسی فناوری‌های توالی یابی نسل دوم منجر می‌شود. [۳] تلاش‌های محاسباتی با هدف غلبه بر این چالش اغلب به برآورد تقریبی تکیه دارد که ممکن است به مونتاژ دقیق توالی‌ها منجر نشود. با قابلیت توالی یابی مستقیم مولکول‌های DNA منفرد، فناوری‌های توالی یابی نسل سوم این توانایی را دارند که خوانش‌هایی به مراتب طویل تر از توالی یابی نسل دوم داشته باشند. [۱] چنین مزیتی هم برای علم ژنوم و هم به‌طور کلی در مورد زیست‌شناسی پیامدهای اساسی دارد. با این حال، داده‌های توالی یابی نسل سوم میزان خطای بسیار بالاتری نسبت به فناوری‌های قبلی دارند، که می‌تواند مونتاژ ژنوم پایین دست و تجزیه و تحلیل داده‌های حاصل را پیچیده کند. [۴] این فناوری‌ها به‌طور فعال در حال توسعه هستند و انتظار می‌رود میزان خطاهای آن‌ها کاهش یابد. برای برنامه‌های کاربردی که تحمل بیشتری نسبت به نرخ خطا دارند، مانند فراخوانی واریانت ساختاری، توالی یابی نسل سوم از روش‌های موجود بهتر عمل می‌کند[نیاز به استناد].

فناوری‌های حاضر[ویرایش]

فناوری‌های توالی یابی با رویکرد متفاوت نسبت به پلت فرم‌های نسل دوم برای اولین بار در سال ۲۰۰۸–۲۰۰۹ به عنوان "نسل سوم" معرفی شدند. [۵] در حال حاضر چندین شرکت در مرکز توسعه فناوری توالی یابی نسل سوم قرار دارند که عبارتند از: Pacific Biosciences, Oxford Nanopore Technology, Quantapore (CA-USA) و Stratos (WA-USA). این شرکت‌ها برای توالی یابی مولکول‌های DNA منفرد رویکردهای کاملاً متفاوتی دارند. PacBio پلت فرم توالی یابی در زمان واقعی مولکول منفرد (SMRT) را بر اساس ویژگی‌های موجبرهای حالت صفر توسعه داد. سیگنال‌ها به شکل نور فلورسنت از هر نوکلئوتیدی که با DNA پلی مراز متصل به کف چاهک zL ترکیب شود، انتشار می‌یابند. فناوری آکسفورد نانوپور شامل عبور یک مولکول DNA از ساختار منفذ با مقیاس نانو و سپس اندازه‌گیری تغییرات میدان الکتریکی اطراف منفذ می‌باشد؛ در حالی که Quantapore یک رویکرد اختصاصی نانوپور دارد. Stratos Genomics با ورود پلی مری، بازهای DNA را خارج می‌کند، "Xpandomers"، برای غلبه سیگنال بر سر و صدای خوانش مولکول‌های تک رشته‌ای DNA نانوپور استفاده می‌شود. همچنین رویکرد فلورسانس مولکول منفرد شرکت Helicos، قابل توجه است، اما این شرکت در پاییز سال ۲۰۱۵ ورشکسته شد.

مزایا[ویرایش]

مزیت بارز توالی یابی نسل سوم در مقایسه با نسل حاضر فناوری‌های توالی یابی، تولید خوانش‌های طویل تر می‌باشد. انتظار می‌رود که این طول خوانش طولانی‌تر، چالش‌های محاسباتی متعددی پیرامون مونتاژ ژنوم، بازسازی رونوشت و متاژنومیکس را در میان دیگر زمینه‌های مهم پزشکی و زیست‌شناسی مدرن کاهش دهد. [۱] واضح است که ژنوم‌های یوکاریوتی از جمله پریمات‌ها و انسان‌ها پیچیده هستند و تعداد زیادی مناطق طویل تکراری دارند. خوانش‌های کوتاه از توالی یابی نسل دوم باید به استراتژی‌های تقریبی متوسل شوند تا بتواند توالی‌های طولانی را برای مونتاژ و فراخوانی واریانت‌های ژنتیکی بدست آورند. برای غلبه بر این محدودیت‌ها، خوانش‌های دو طرفه توالی یابی نسل دوم اعمال شده‌است. با این حال، طول دقیق قطعه دو طرفه خوانده شده اغلب ناشناخته است و لذا باید تخمین زده شود. مزایای فناوری‌های توالی یابی نسل سوم با ممکن ساختن خوانش‌های طویل واضح می‌باشد.

اپی ژنتیک[ویرایش]

نشانگرهای اپی ژنتیکی تغییرات پایدار و بالقوه ارثی در مولکول DNA می‌باشند که در توالی آن نیستند. یک مثال متیلاسیون DNA در محل‌های CpG است که مشخص شده‌است بر بیان ژن تأثیر می‌گذارد. یک نمونه دیگر تغییرات هیستونی می‌باشد. نسل حاضر فناوری‌های توالی یابی برای تشخیص نشانگرهای اپی ژنتیکی به روش‌های آزمایشگاهی مانند توالی یابی ChIP متکی هستند. این روش‌ها شامل برچسب زدن به رشته DNA، شکستن و فیلتر کردن قطعاتی است که حاوی نشانگر هستند و به دنبال آن توالی یابی. توالی یابی نسل سوم ممکن است به دلیل سیگنال متمایز از چهار باز دیگر نوکلئوتیدی، شناسایی مستقیم این نشانگرها را ممکن سازد. [۶]

قابلیت حمل و سرعت[ویرایش]

از دیگر مزایای مهم فناوری‌های توالی یابی نسل سوم می‌توان به قابلیت حمل و سرعت توالی یابی اشاره نمود. [۷] از آنجا که حداقل پردازش نمونه در مقایسه با توالی یابی نسل دوم مورد نیاز است، امکان طراحی تجهیزات در اندازه کوچک وجود دارد. اخیراً شرکت Oxford Nanopore Technology دستگاه توالی یابی Minion را تجاری کرده‌است. این دستگاه توالی یابی تقریباً اندازه فلش مموری USB معمولی است و با اتصال به لپ تاپ به راحتی قابل استفاده است. علاوه بر این، از آنجا که فرایند توالی یابی در مناطق ژنوم موازی نیست، داده‌ها را می‌توان در زمان واقعی جمع‌آوری و تجزیه و تحلیل کرد. این مزایای توالی یابی نسل سوم ممکن است در بیمارستان که نیازمند جمع‌آوری و تجزیه و تحلیل سریع داده‌ها است، مناسب باشد.

چالش‌ها[ویرایش]

توالی یابی نسل سوم، همان‌طور که در حال حاضر مواجه است، با چالش‌های مهمی که عمدتاً در شناسایی دقیق بازهای نوکلئوتیدی وجود دارد روبرو است. نرخ خطا در مقایسه با توالی نسل دوم هنوز بسیار بیشتر است. [۴] این امر به‌طور کلی به دلیل ناپایداری ماشین‌های مولکولی درگیر می‌باشد. به عنوان مثال، در فناوری توالی یابی مولکولی منفرد و زمان واقعی PacBio، مولکول DNA پلی مراز همان‌طور که روند توالی یابی انجام می‌شود، به‌طور فزاینده ای آسیب می‌بیند. [۴] علاوه بر این، از آنجا که این روند به سرعت اتفاق می‌افتد، ممکن است سیگنال‌هایی که توسط بازهای منفرد خاموش می‌شوند با سیگنال‌های بازهای همسایه محو شوند. این یک چالش محاسباتی جدید برای رمزگشایی سیگنال‌ها و در نتیجه استنباط توالی است. به عنوان مثال، بدین منظور روش‌هایی مانند مدل‌های مارکوف پنهان با موفقیت‌هایی به کار گرفته شده‌است. [۶] به‌طور متوسط، حدود ۹۹٫۹٪ از ژن‌های افراد مختلف جمعیت انسانی مشترک می‌باشد. به عبارت دیگر، تقریباً از هر هزار باز فقط یک بازبین دو فرد متفاوت است. نرخ خطای بالای ناشی از توالی یابی نسل سوم به منظور تعیین تفاوت‌های فردی بین اعضای یک گونه، ناگزیر مشکل ساز است.

مونتاژ ژنوم[ویرایش]

مونتاژ ژنوم بازسازی توالی DNA کل ژنوم است. این به‌طور کلی با دو رویکرد کاملاً متفاوت انجام می‌شود.

ردیف سازی مرجع[ویرایش]

هنگامی که یک ژنوم مرجع در دسترس باشد، همان‌طور که در مورد انسان وجود دارد، خوانش‌های توالی تازه می‌توانند به منظور تعیین خصوصیات آن با ژنوم مرجع ردیف شوند. چنین مونتاژ مبتنی بر مرجع سریع و آسان است اما عیب آن «پنهان کردن» توالی‌های جدید و واریانت‌های تعداد نسخه بزرگ می‌باشد. علاوه بر این، ژنوم مرجع برای اکثر ارگانیسم‌ها هنوز وجود ندارند.

مونتاژ از نو[ویرایش]

مونتاژ از نو روش جایگزین مونتاژ ژنوم برای ردیف سازی مرجع است. این کاملاً به بازسازی توالی‌های کل ژنوم از خوانش‌های توالی خام بر می‌گردد. این روش زمانی انتخاب می‌شود که ژنوم مرجع وجود نداشته باشد، هنگامی که گونه ارگانیسم مورد نظر ناشناخته باشد مثل متاژنومیکس، یا هنگامی که واریانت‌های ژنتیکی مورد نظر با ردیف سازی ژنوم مرجع تشخیص داده نمی‌شوند. با توجه به خوانش‌های کوتاه تولید شده توسط نسل حاضر فناوری‌های توالی یابی، مونتاژ از نو یک مشکل بزرگ محاسباتی است. به‌طور معمول با یک روند تکرار شونده برای یافتن و اتصال خوانش‌های توالی با همپوشانی معقول خوانده می‌شود، نزدیک می‌شوید. روش‌های مختلف محاسباتی و آماری مانند نمودارهای de bruijn و نمودارهای مورد توافق طرح همپوشان، برای حل این مشکل به کار گرفته شده‌است. با این وجود، با توجه به ماهیت بسیار تکراری ژنوم یوکاریوتی، بازسازی دقیق و کامل توالی ژنوم در مونتاژ از نو چالش‌برانگیز است. خوانش‌های دو طرفه به عنوان یک راه حل ممکن مطرح شده‌است، اگرچه طول قطعه دقیقاً شناخته شده نیست و باید تقریبی محاسبه شود. [۸] مونتاژ دورگه - استفاده از خوانش‌های موجود در پلت فرم توالی یابی نسل سوم با خوانش‌های کوتاه پلت فرم نسل دوم - ممکن است برای رفع ابهامات در ژنوم‌هایی که قبلاً با استفاده از توالی یابی نسل دوم مونتاژ شده‌اند، استفاده شود. از خوانش‌های کوتاه نسل دوم نیز برای اصلاح خطاهایی که در خوانش‌های طویل نسل سوم وجود دارد، استفاده می‌گردد.

مونتاژ دورگه[ویرایش]

خوانش طویل که توسط توالی یابی نسل سوم ارائه شده‌است، می‌تواند بسیاری از چالش‌های کنونی که مونتاژ ژنومی از نو با آن مواجه می‌شود را کاهش دهد. به عنوان مثال، اگر کل یک منطقه تکراری بتواند به‌طور واضح در یک خوانش توالی یابی شود، هیچ نتیجه‌گیری محاسبه ای دیگری لازم نیست. روش‌های محاسباتی برای کاهش میزان خطای بالا پیشنهاد شده‌اند. به عنوان مثال، در یک مطالعه، نشان داده شد که مونتاژ از نو ژنوم میکروبی با استفاده از توالی یابی PacBio به تنهایی عملکرد برتری از توالی یابی نسل دوم دارد. [۹] توالی یایی نسل سوم ممکن است همچنین همراه با توالی یابی نسل دوم نیز استفاده شود. به این روش اغلب به عنوان توالی یابی دورگه اشاره می‌شود. به عنوان مثال، خوانش‌های طویل از توالی یابی نسل سوم ممکن است برای رفع ابهامات در ژنوم‌هایی که قبلاً با استفاده از توالی یابی نسل دوم مونتاژ شده‌اند، استفاده گردد. از طرف دیگر، خوانش‌های توالی یابی نسل دوم کوتاه، برای اصلاح خطاهای موجود در خوانش‌های طویل نسل سوم استفاده شده‌است. به‌طور کلی، این رویکرد دورگه به‌طور قابل توجهی موجب بهبود مونتاژ ژنوم از نو می‌شود. [۱۰]

نشانگرهای اپی ژنتیکی[ویرایش]

متیلاسیون DNA (DNAm)-تغییر کووالانسی DNA در محل‌های CpG که منجر به اتصال گروه‌های متیل می‌شود - بهترین جزء قابل درک ماشین اپی ژنتیک است. تغییرات DNA و بیان ژن ناشی از آن می‌تواند در انواع سلول‌ها متفاوت باشد. دوره تکوین، با دودمان ژنتیکی، به دلیل محرک‌های محیطی می‌تواند تغییر کند و قابل توارث هستند. محققان پس از کشف DNAm، همبستگی آن را با بیماری‌هایی مانند سرطان و اوتیسم نیز پیدا کردند. [۱۱] در سبب‌شناسی این بیماری‌ها بستر DNAm یک راه مهم برای تحقیقات بیشتر است.

مزایا[ویرایش]

متداول‌ترین روش‌های حاضر برای بررسی وضعیت متیلاسیون نیازمند سنجش قطعات DNA قبل از توالی یابی نسل دوم استاندارد، بر روی پلت فرم Illumina می‌باشد. در نتیجه خوانش کوتاه، اطلاعات مربوط به الگوهای طولانی‌تر متیلاسیون از بین می‌رود. [۶] فناوری‌های توالی یابی نسل سوم، قابلیت توالی یابی مولکول‌های منفرد در زمان واقعی را از خوانش‌های طویل تر و شناسایی تغییرات DNA بدون سنجش‌هایی که ذکر شد را ارائه می‌دهد. [۱۲] فناوری PacBio SMRT و Oxford Nanopore می‌توانند از DNA تغییر نیافته برای تشخیص متیلاسیون استفاده کنند. دستگاه MinION شرکت Oxford Nanopore Technologgies برای تشخیص DNAm استفاه شده‌است. از آنجا که هر رشته DNA از یک منفذ عبور می‌کند، سیگنال‌های الکتریکی تولید می‌کند که مشخص شده به تغییرات اپی ژنتیکی موجود در نوکلئوتیدها حساس هستند و از یک مدل مارکوف پنهان (HMM) برای تجزیه و تحلیل داده‌های MinION برای شناسایی تغییرات ۵-متیل سیتوزین (5mC) DNA استفاده شده‌است. اصلاح. [۶] این مدل با استفاده از DNA متیله شدهE. coli که به‌صورت مصنوعی سنتز شده و سیگنال‌های حاصل از آن که با استفاده از فناوری نانوپور اندازه‌گیری شده‌است، ارایه داده‌است. پس از آن، مدل برای تشخیص ۵- متیل سیتوزین در خوانش‌های ژنومیک MinION حاصل از یک رده سلولی انسانی که قبلاً یک متیلوم مرجع داشت، استفاده شد. طبقه‌بندی کننده دارای دقت ۸۲٪ در محل‌های تک نمونه ای تصادفی است، هنگامی که از حد آستانه‌های سخت گیرانه استفاده شود تا ۹۵٪ افزایش می‌یابد. [۶] روش‌های دیگر، انواع مختلفی از تغییرات DNA را با استفاده از پلت فرم MinION ارائه می‌دهند. استویبر و همکاران ۴-متیل سیتوزین (4-mC) و ۶-متیل آدنین (6mA) را به همراه ۵-متیل سیتوزین (5mC) مورد بررسی قرار دادند، و همچنین یک نرم‌افزار ایجاد کردند تا مستقیماً داده‌های خام MinION را به روش آسانی بصری کند. [۱۳] در اینجا آن‌ها دریافتند که در E. coli، که دارای متیلوم شناخته شده‌است، می‌توان از پنجره‌های رویداد به طول ۵ جفت باز برای تقسیم و تجزیه و تحلیل آماری سیگنال‌های الکتریکی خام MinION استفاده نمود. یک آزمون ساده Mann-Whitney U test می‌تواند بخش‌های تغییر یافته از توالی E. coli را تشخیص دهد، و همچنین تغییرات را به مناطق 4mC، 6mA یا 5mC تقسیم کند. [۱۳] به نظر می‌رسد در آینده از داده‌های خام MinION برای تشخیص بسیاری از علائم گوناگون اپی ژنتیکی در DNA استفاده شود. برای تعیین متیلاسیون DNA از توالی یابی PacBio نیز استفاده شده‌است. در این پلت فرم گستره پالس - گستره یک پالس نور فلورسنت - به یک باز خاص مربوط می‌شود. در سال ۲۰۱۰ نشان داده شد که فاصله بینابینی در نمونه‌های شاهد و متیله شده متفاوت است و برای هر نوع متیلاسیون یک گستره پالس «منحصر به فرد» وجود دارد. [۱۲] در سال ۲۰۱۲ با استفاده از پلت فرم PacBio، محل‌های اتصال DNA متیل ترانسفرازها مشخص شد. [۱۴] شناسایی متیلاسیون N6 در کرم C Elegans در سال ۲۰۱۵ نشان داده شد. [۱۵] متیلاسیون DNA روی N6-adenine با استفاده از پلت فرم PacBio در سلول‌های بنیادی جنینی موش در سال ۲۰۱۶ نشان داده شد. [۱۶] اشکال دیگری از تغییرات DNA -ناشی از فلزات سنگین، اکسیداسیون یا آسیب با اشعه فرا بنفش - نیز راه‌های تحقیقاتی هستند که با استفاده از توالی یابی نسل سوم Oxford Nanopore و PacBio امکان‌پذیر می‌باشند.

معایب[ویرایش]

پردازش داده‌های خام - مانند نرمال سازی با سیگنال میانگین - بر روی داده‌های خام MinION نیاز بود و باعث کاهش توانایی در زمان واقعی فناوری می‌شد. [۱۳] پایداری سیگنال‌های الکتریکی هنوز یک معضل است و فراخوانی دقیق نوکلئوتید را دشوار می‌کند. MinION توان عملیاتی کمی دارد؛ از آنجا که خوانش‌های هم پوشان متعدد بسیار دشوار بدست می‌آیند، این خوانش‌های بیشتر، منجر به رفع مشکلات شناسایی تغییرات پایین دست DNA می‌شود هم مدل مارکوف پنهان و هم روش‌های آماری که از داده‌های خام MinION استفاده نموده‌است نیازمند مشاهدات مکرر از تغییرات DNA برای تشخیص می‌باشد، به این معنی که نوکلئوتیدهای تغییر یافته منفرد باید به‌طور مداوم در چندین نسخه از ژنوم حضور داشته باشند، به عنوان مثال در چندین سلول یا پلاسمید موجود در نمونه. برای پلت فرم PacBio نیز بسته به نوع متیلاسیون دلخواه، نیازهای پوشش متفاوت است. از مارس ۲۰۱۷، سایر عوامل اپی ژنتیکی مانند تغییرات هیستونی با استفاده از فناوری‌های نسل سوم قابل کشف نیستند. الگوهای طویل متیلاسیون غالباً بعلت اینکه هنوز نیاز به مونتاژ کانتیگ‌های کوچکتر است، از بین می‌روند.

ترانسکریپتومیکس[ویرایش]

ترانسکریپتومیکس به معنی مطالعه ترانسکریپتوم است، معمولاً بعنوان فراوانی نسبی مولکول‌های mRNA بافت مورد مطالعه توصیف می‌شود. با توجه اصل بنیادین زیست‌شناسی مولکولی، اطلاعات ژنتیکی از مولکول‌های DNA دو رشته‌ای به مولکول‌های mRNA تک رشته‌ای جریان می‌یابند جایی که می‌توانند به آسانی به مولکول‌های پروتئین عملکرد ی ترجمه شوند. با مطالعه ترانسکریپتوم، می‌توانید درک ارزشمندی در تنظیم بیان ژن کسب کنید. در حالی که میزان بیان به عنوان میزان ژن می‌تواند کم و بیش به‌طور دقیق توسط توالی یابی نسل دوم به تصویر کشیده شود، اطلاعات میزان رونوشت هنوز یک چالش مهم است. [۱۷] در نتیجه، نقش پیرایش متناوب در زیست‌شناسی مولکولی تا حد زیادی مبهم است. فناوری‌های توالی یابی نسل سوم با توالی یابی کامل مولکول‌های mRNA، چشم‌انداز امیدوار کننده ای برای حل این مسئله دارند.

پیرایش متناوب[ویرایش]

پیرایش متناوب (AS) فرایندی است که با استفاده از آن یک ژن واحد می‌تواند چندین نسخه متمایز mRNA و در نتیجه ترجمه‌های پروتئینی متفاوتی ایجاد کند. [۱۸] برخی شواهد نشان می‌دهد که پیرایش متناوب یک پدیده همه جایی است و ممکن است نقش مهمی در تعیین فنوتیپ‌های موجودات زنده به‌ویژه در یوکاریوت‌های پیچیده ایفا کند. همه یوکاریوت‌ها حاوی ژن‌هایی هستند که از اینترون‌ها تشکیل شده‌اند. به‌طور خاص، تخمین زده شده‌است که پیرایش متناوب در ۹۵٪ از کل ژن‌های چند اگزون انسانی رخ می‌دهد. [۱۹] پیرایش متناوب پتانسیل غیرقابل انکاری بر بسیاری از روندهای زیستی دارد. پیشرفت دانش در این زمینه به‌طور کلی پیامدهای اساسی برای مطالعه زیست‌شناسی دارد.

بازسازی رونوشت[ویرایش]

نسل حاضر فناوری‌های توالی یابی فقط خوانش‌های کوتاه را تولید می‌کند، که محدودیت فوق‌العاده ای در توانایی تشخیص رونوشت‌های مجزا ایجاد می‌کند. خوانش‌های کوتاه باید با مهندسی معکوس به رونوشت‌های اصلی تبدیل شوند که می‌تواند منجر به مشاهده خوانش‌ها گردد. [۲۰] این وظیفه توسط میزان بیان بسیار متغیر در رونوشت‌ها و در نتیجه پوشش متغیر خوانش توالی ژن پیچیدگی بیشتری می‌یابد. [۲۰] علاوه بر این، اگزون‌ها ممکن است در میان رونوشت‌های خاصی به اشتراک گذاشته شوند، لذا تفسیر واضح اساساً غیرممکن است. [۱۸] روش‌های محاسباتی موجود، تفسیرها را بر اساس تجمع خوانش‌های کوتاه در توالی‌های مختلف اغلب با ساختن فرضیات ساده انجام می‌دهد. [20] Cufflinks، یک رویکرد صرفه جویانه ای را در پیش می‌گیرد و در پی توضیح همه خوانش‌ها با کمترین تعداد ممکن از رونوشت‌ها است. [۲۱] از سوی دیگر، StringTie تلاش می‌کند تا ضمن جمع‌آوری خوانش‌ها، فراوانی رونوشت‌ها را هم برآورد کند. [۲۰] این روش‌ها، اگرچه منطقی هستند، همیشه رونوشت‌های واقعی را نمی‌توانند شناسایی کنند. مطالعه ای که در سال ۲۰۰۸ منتشر شد، ۲۵ پروتکل مختلف موجود در بازسازی رونوشت را مورد بررسی قرار داد. [۱۷] این شواهد نشان می‌دهد که روش‌های موجود معمولاً در مونتاژ رونوشت‌ها ضعیف هستند، اگرچه توانایی تشخیص اگزون‌های منفرد را به‌طور نسبتاً بی عیبی دارند. [۱۷] طبق برآوردها، میانگین حساسیت تشخیص اگزون‌ها در ۲۵ پروتکل برای ژن‌های کرم Caenorhabditis elegans 80% است. [۱۷] در مقابل، حساسیت شناسایی رونوشت‌ها به ۶۵٪ کاهش می‌یابد. بر اساس نتایج این مطالعه در انسان، میانگین حساسیت تشخیص اگزون ۶۹٪ و میانگین حساسیت تشخیص رونوشت‌ها تنها ۳۳٪ می‌باشد. [۱۷] به عبارت دیگر، برای انسان، روش‌های موجود قادر به شناسایی کمتر از نیمی از کل رونوشت‌های موجود هستند. فناوری‌های توالی یابی نسل سوم چشم‌انداز امیدوار کننده ای در حل مسئله تشخیص رونوشت و همچنین برآورد فراوانی mRNA در سطح رونوشت‌ها نشان داده‌است. در حالی که نرخ خطا همچنان بالاست، فناوری‌های توالی یابی نسل سوم این توانایی را دارند که طول خوانش بسیار بیشتری داشته باشند. [۲۲] شرکت Pacific Bioscience پلت فرم iso-seq را معرفی کرده‌است و ادعا می‌کند که مولکول‌های mRNA را در طول کاملشان توالی یابی می‌کند.[۲۲] پیش‌بینی می‌شود شرکتOxford Nanopore فناوری‌های مشابهی را ارائه دهد. مشکلی که در نرخ خطای بالاتر وجود دارد ممکن است با خوانش‌های کوتاه با کیفیت بالا کاهش یابد. این روش قبلاً آزمایش شده و گزارش شده‌است که میزان خطا را بیش از ۳ برابر کاهش می‌دهد. [۲۳]

متاژنومیکس[ویرایش]

متاژنومیکس آنالیز مواد ژنتیکی است که به‌طور مستقیم از نمونه‌های محیطی بازیابی می‌شود.

مزایا[ویرایش]

مهمترین مزیت فناوری‌های توالی یابی نسل سوم در متاژنومیکس سرعت توالی یابی آن‌ها در مقایسه با روش‌های نسل دوم است. سرعت توالی یابی برای مثال در کلینیک (مانند شناسایی پاتوژن) از اهمیت زیادی برخوردار است، تا امکان تشخیص کارآمد و اقدامات بالینی به موقع فراهم شود. دستگاه Minion شرکت آکسفورد نانوپور در سال ۲۰۱۵ برای تشخیص متابوژنومیک در زمان واقعی پاتوژن‌ها در نمونه‌های بالینی پیچیده و با پر خطر استفاده شد. اولین ویروس ابولا (EBV) 44 ثانیه پس از جمع‌آوری داده‌ها توالی یابی شد. [۲۴] در اینجا نقشه خوانی یکنواخت برای خوانش‌های ژنوم وجود داشت. حداقل یک خوانش با بیش از ۸۸٪ ژنوم نقشه‌برداری شده مطابقت داشت. خوانش‌های نسبتاً طویل، توالی یابی تقریباً کامل ژنوم ویروسی را با دقت بالا (مطابقت ۹۷–۹۹٪) مستقیماً از یک نمونه بالینی اولیه امکان‌پذیر می‌سازد. [۲۴] یک نشانگر فیلوژنتیک رایج برای مطالعات تنوع جامعه میکروبی ژن RNA ریبوزومی S 16 است. پلت فرم‌های SMRT Minion و PacBio برای توالی یابی این ژن استفاده شده‌اند. [۲۵] [۲۶] در این زمینه، میزان خطای PacBio قابل مقایسه با خوانش‌های کوتاه‌تر ۴۵۴ و پلت فرم دستگاه MiSeq شرکت Illumina است. [نیاز به استناد]

معایب[ویرایش]

میزان خطای بالای MinION (40%-10) از شناسایی نشانگرهای مقاومت ضد میکروبی جلوگیری می‌کند، که بدین منظور تفکیک تک نوکلئوتیدی لازم است. به همین علت، پاتوژن‌های یوکاریوتی شناسایی نشده‌اند. [۲۴] همچنین سهولت انتقال آلودگی هنگام استفاده مجدد از flow cell (دستورالعمل‌های شستشوی استاندارد کار نمی‌کنند) نگران کننده است. بارکدهای منحصر به فرد ممکن است امکان تعدد آزمایش را فراهم کنند. علاوه بر این، انجام شناسایی دقیق گونه‌های باکتریایی، قارچ و انگل‌ها بسیار دشوار است، زیرا آن‌ها بخش بیشتری از ژنوم را به اشتراک می‌گذارند، برخی از آنها تنها کمتر از ۵٪ تفاوت دارند. هزینه توالی یابی هر باز هنوز هم به‌طور قابل توجهی بیشتر از MiSeq است. با این حال، چشم‌انداز تکمیل پایگاه‌های داده‌های مرجع با توالی‌های کامل از موجوداتی که زیر حد تشخیص رویکرد سانگر هستند؛ [۲۵] احتمالاً می‌تواند تا حد زیادی در شناسایی ارگانیسم‌ها در متاژنومیکس کمک کند.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

1 Bleidorn, Christoph (2016-01-02). "Third generation sequencing: technology and its potential impact on evolutionary biodiversity research". Systematics and Biodiversity. 14 (1): 1–8. doi:10.1080/14772000.2015.1099575. ISSN 1477-2000.

2. ^ "Illumina sequencing technology" (PDF).

3. ^ Jump up to:a b c Treangen, Todd J. ; Salzberg, Steven L. (2012-01-01). "Repetitive DNA and next-generation sequencing: computational challenges and solutions". Nature Reviews Genetics. 13 (1): 36–46. doi:10.1038/nrg3117. ISSN 1471-0056. PMC 3324860. PMID 22124482.

4. ^ Jump up to:a b c Gupta, Pushpendra K. (2008-11-01). "Single-molecule DNA sequencing technologies for future genomics research". Trends in Biotechnology. 26 (11): 602–611. doi:10.1016/j.tibtech.2008.07.003. PMID 18722683.

5. ^ Check Hayden, Erika (2009-02-06). "Genome sequencing: the third generation". Nature News. 457 (7231): 768–769. doi:10.1038/news.2009.86. PMID 19212365.

6. ^ Jump up to:a b c d e Simpson, Jared T. ; Workman, Rachael; Zuzarte, Philip C. ; David, Matei; Dursi, Lewis Jonathan; Timp, Winston (2016-04-04). "Detecting DNA Methylation using the Oxford Nanopore Technologies MinION sequencer". bioRxiv 10.1101/047142.

7. ^ Schadt, E. E. ; Turner, S. ; Kasarskis, A. (2010-10-15). "A window into third-generation sequencing". Human Molecular Genetics. 19 (R2): R227–R240. doi:10.1093/hmg/ddq416. ISSN 0964-6906. PMID 20858600.

8. ^ Li, Ruiqiang; Zhu, Hongmei; Ruan, Jue; Qian, Wubin; Fang, Xiaodong; Shi, Zhongbin; Li, Yingrui; Li, Shengting; Shan, Gao (2010-02-01). "De novo assembly of human genomes with massively parallel short read sequencing". Genome Research. 20 (2): 265–272. doi:10.1101/gr.097261.109. ISSN 1088-9051. PMC 2813482. PMID 20019144.

9. ^ Chin, Chen-Shan; Alexander, David H. ; Marks, Patrick; Klammer, Aaron A. ; Drake, James; Heiner, Cheryl; Clum, Alicia; Copeland, Alex; Huddleston, John (2013-06-01). "Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data". Nature Methods. 10 (6): 563–569. doi:10.1038/nmeth.2474. ISSN 1548-7091. PMID 23644548.

10. ^ Goodwin, Sara; Gurtowski, James; Ethe-Sayers, Scott; Deshpande, Panchajanya; Schatz, Michael C. ; McCombie, W. Richard (2015-11-01). "Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome". Genome Research. 25(11): 1750–1756. doi:10.1101/gr.191395.115. ISSN 1088-9051. PMC 4617970. PMID 26447147.

11. ^ Fraser, Hunter B. ; Lam, Lucia L. ; Neumann, Sarah M. ; Kobor, Michael S. (2012-02-09). "Population-specificity of human DNA methylation". Genome Biology. 13 (2): R8. doi:10.1186/gb-2012-13-2-r8. ISSN 1474-760X. PMC 3334571. PMID 22322129.

12. ^ Jump up to:a b Flusberg, Benjamin A. ; Webster, Dale R. ; Lee, Jessica H. ; Travers, Kevin J. ; Olivares, Eric C. ; Clark, Tyson A. ; Korlach, Jonas; Turner, Stephen W. (2010-06-01). "Direct detection of DNA methylation during single-molecule, real-time sequencing". Nature Methods. 7 (6): 461–465. doi:10.1038/nmeth.1459. PMC 2879396. PMID 20453866.

13. ^ Jump up to:a b c Stoiber, Marcus H. ; Quick, Joshua; Egan, Rob; Lee, Ji Eun; Celniker, Susan E. ; Neely, Robert; Loman, Nicholas; Pennacchio, Len; Brown, James B. (2016-12-15). "De novo Identification of DNA Modifications Enabled by Genome-Guided Nanopore Signal Processing". bioRxiv 10.1101/094672.

14. ^ Clark, T. A. ; Murray, I. A. ; Morgan, R. D. ; Kislyuk, A. O. ; Spittle, K. E. ; Boitano, M. ; Fomenkov, A. ; Roberts, R. J. ; Korlach, J. (2012-02-01). "Characterization of DNA methyltransferase specificities using single-molecule, real-time DNA sequencing". Nucleic Acids Research. 40 (4): e29. doi:10.1093/nar/gkr1146. ISSN 0305-1048. PMC 3287169. PMID 22156058.

15. ^ Greer, Eric Lieberman; Blanco, Mario Andres; Gu, Lei; Sendinc, Erdem; Liu, Jianzhao; Aristizábal-Corrales, David; Hsu, Chih-Hung; Aravind, L. ; He, Chuan (2015). "DNA Methylation on N6-Adenine in C. elegans". Cell. 161 (4): 868–878. doi:10.1016/j.cell.2015.04.005. PMC 4427530. PMID 25936839.

16. ^ Wu, Tao P. ; Wang, Tao; Seetin, Matthew G. ; Lai, Yongquan; Zhu, Shijia; Lin, Kaixuan; Liu, Yifei; Byrum, Stephanie D. ; Mackintosh, Samuel G. (2016-04-21). "DNA methylation on N6-adenine in mammalian embryonic stem cells". Nature. 532 (7599): 329–333. Bibcode:2016Natur.532..329W. doi:10.1038/nature17640. ISSN 0028-0836. PMC 4977844. PMID 27027282.

17. ^ Jump up to:a b c d e Steijger, Tamara; Abril, Josep F. ; Engström, Pär G. ; Kokocinski, Felix; The RGASP Consortium; Hubbard, Tim J. ; Guigó, Roderic; Harrow, Jennifer; Bertone, Paul (2013-12-01). "Assessment of transcript reconstruction methods for RNA-seq". Nature Methods. 10 (12): 1177–1184. doi:10.1038/nmeth.2714. ISSN 1548-7091. PMC 3851240. PMID 24185837.

18. ^ Jump up to:a b Graveley, Brenton R. (2001). "Alternative splicing: increasing diversity in the proteomic world". Trends in Genetics. 17 (2): 100–107. doi:10.1016/s0168-9525(00)02176-4. PMID 11173120.

19. ^ Pan, Qun; Shai, Ofer; Lee, Leo J. ; Frey, Brendan J. ; Blencowe, Benjamin J. (2008-12-01). "Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing". Nature Genetics. 40 (12): 1413–1415. doi:10.1038/ng.259. ISSN 1061-4036. PMID 18978789.

20. ^ Jump up to:a b c d Pertea, Mihaela; Pertea, Geo M. ; Antonescu, Corina M. ; Chang, Tsung-Cheng; Mendell, Joshua T. ; Salzberg, Steven L. (2015-03-01). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads". Nature Biotechnology. 33 (3): 290–295. doi:10.1038/nbt.3122. ISSN 1087-0156. PMC 4643835. PMID 25690850.

21. ^ Trapnell, Cole; Williams, Brian A. ; Pertea, Geo; Mortazavi, Ali; Kwan, Gordon; van Baren, Marijke J. ; Salzberg, Steven L. ; Wold, Barbara J. ; Pachter, Lior (2010-05-01). "Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation". Nature Biotechnology. 28 (5): 511–515. doi:10.1038/nbt.1621. ISSN 1087-0156. PMC 3146043. PMID 20436464.

22. ^ Jump up to:a b Abdel-Ghany, Salah E. ; Hamilton, Michael; Jacobi, Jennifer L. ; Ngam, Peter; Devitt, Nicholas; Schilkey, Faye; Ben-Hur, Asa; Reddy, Anireddy S. N. (2016-06-24). "A survey of the sorghum transcriptome using single-molecule long reads". Nature Communications. 7: 11706. Bibcode:2016NatCo...711706A. doi:10.1038/ncomms11706. ISSN 2041-1723. PMC 4931028. PMID 27339290.

23. ^ Au, Kin Fai; Underwood, Jason G. ; Lee, Lawrence; Wong, Wing Hung (2012-10-04). "Improving PacBio Long Read Accuracy by Short Read Alignment". PLOS ONE. 7 (10): e46679. Bibcode:2012PLoSO...746679A. doi:10.1371/journal.pone.0046679. ISSN 1932-6203. PMC 3464235. PMID 23056399.

24. ^ Jump up to:a b c Greninger, Alexander L. ; Naccache, Samia N. ; Federman, Scot; Yu, Guixia; Mbala, Placide; Bres, Vanessa; Stryke, Doug; Bouquet, Jerome; Somasekar, Sneha (2015-01-01). "Rapid metagenomic identification of viral pathogens in clinical samples by real-time nanopore sequencing analysis". Genome Medicine. 7: 99. doi:10.1186/s13073-015-0220-9. ISSN 1756-994X. PMC 4587849. PMID 26416663.

25. ^ Jump up to:a b Schloss, Patrick D. ; Jenior, Matthew L. ; Koumpouras, Charles C. ; Westcott, Sarah L. ; Highlander, Sarah K. (2016-01-01). "Sequencing 16S rRNA gene fragments using the PacBio SMRT DNA sequencing system". PeerJ. 4: e1869. doi:10.7717/peerj.1869. PMC 4824876. PMID 27069806.

26. ^ Benítez-Páez, Alfonso; Portune, Kevin J. ; Sanz, Yolanda (2016-01-01). "Species-level resolution of 16S rRNA gene amplicons sequenced through the MinION™ portable nanopore sequencer". GigaScience. 5: 4. doi:10.1186/s13742-016-0111-z. ISSN 2047-217X. PMC 4730766. PMID 26823973.

متن چپ‌چین‌شده