پروژه ۱۰۰۰ ژنوم

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو
پروژه ۱۰۰۰ ژنوم، مطالعه ۵ جامعه ژنتیکی

پروژه ۱۰۰۰ ژنوم (به انگلیسی: 1000 genomes project) یک پروژه تحقیقاتی بین‌المللی برای فراهم کردن یک فهرست جامع و بسیار دقیق از تنوّع ژنتیکی انسان است. یکی از اهداف مهم این بررسی کشف روابط بین فنوتیپ (رُخ‌نمود) و ژنوتیپ (اطلاعات ژنتیکی)، بررسی تکامل و عوامل تأثیرگذار در بیماری‌های با عامل ژنتیکی در انسان است.[۱] این پروژه در سال ۲۰۰۸ با همکاری مؤسسه ملی تحقیقات ژنوم انسان (آمریکا)، مؤسسه سَنگِر (انگلستان) و مؤسسه ژنومیک بجینگ (چین) آغاز شد. در این پروژه محققان قصد داشتند ژنوم حداقل ۱۰۰۰ فرد ناشناس از اقوام مختلف را با استفاده از روش‌های جدید که نسبت به روش‌های قدیمی، سریع‌تر و ارزان‌تر بودند توالی‌یابی کنند.[۲]

این پروژه در چند بخش و روی ۲۶ زیرجامعه ژنتیکی (۵ جامعه بزرگ از شرق آسیا، اروپا، آفریفا، آمریکا و آمریکای جنوبی) مختلف انجام شد. پروژه شامل سه پروژه آزمایشی ابتدایی و یک پروژه اصلی بود که به سه فاز تقسیم می‌شد. پروژه‌های آزمایشی تا ژوئن سال ۲۰۰۹ به پایان رسیدند و فاز نهایی پروژه تا سال ۲۰۱۵ کامل شد. محصول فاز نهایی یک مجموعه دادهٔ تحلیل‌شده شامل ژنوم ۲۵۰۴ نفر است.[۳]

در حین پیشرفت پروژه و با پایان‌یافتن هر فاز، داده‌ها برای عموم منتشر و نتایج تحقیقات در مجله نیچر چاپ می‌شد. علاوه بر این، بسیاری از مقالات در مجله نیچر به کاربردهای پروژه ۱۰۰۰ ژنوم در ژنتیک، پزشکی و داروسازی اختصاص یافت.[۱][۳][۴][۵]

این پروژه با فراهم‌کردن یک نمای کلّی از تنوّع ژنتیکی انسان که در آزمایش‌ها پیشین قابل دست‌یابی نبودند، توانست به یک ابزار بسیار ارزشمند و کارا برای بسیاری از زمینه‌های علوم زیستی از جمله ژنتیک، پزشکی، داروسازی و بیوانفورماتیک تبدیل شود.

پیشینه[ویرایش]

تغییر در تعداد و ترتیب ژن‌ها باعث تفاوت‌های ژنتیکی بین جوامع می‌شود.

مطالعه روی ژنوم انسان[ویرایش]

کشف روابط بین ژنوتیپ و فنوتیپ یکی از مهم‌ترین اهداف در زیست‌شناسی و پزشکی است. ژنوم مرجع انسان، توانست مطالعه ژنتیک انسانی را فراهم کند.[۶]

تا کنون پروژه‌های مختلفی روی ژنوم انسان برای کشف ساختار و تنوع صورت گرفته‌است که دو تا از مهمترین پروژه‌ها در این زمینه، پروژه ژنوم انسان (۱۹۹۱ تا ۲۰۰۱) و پروژه هپ‌مپ (۲۰۰۲ تا ۲۰۰۹) هستند.[۷][۸]

پروژه ژنوم انسان[ویرایش]

بعد از تکمیل پروژه ژنوم انسان و پیشرفت‌ها در ژنتیک جمعیت و ژنومیک مقایسه‌ای، ابزارها در بررسی تنوّع ژنتیکی گسترش یافتند. اما مسائلی مثل تفاوت‌های ساختاری دی ان ای، جهش‌های نقطه‌ای و مباحث جدّی در انتخاب طبیعی، همچنان باز هستند؛ لذا نیاز است تا تحقیقات روی داده‌های بزرگ‌تر، جوامع متنوّع‌تر و با دقت بالاتر انجام شوند.[۷]

پروژه هپ‌مپ[ویرایش]

این نمودار میزان رجوع به منابع پروژه هپ‌مپ در سایت NCBI را بین سال‌های ۲۰۱۳ تا ۲۰۱۵ را نشان می‌دهد.

پروژه هپ‌مپ (HapMap) یک پروژه تحقیقاتی بود که در آن تلاش می‌شد، نواحی‌ای در ژنوم را بیابیم که با روی دادن یک فنوتیپ خاص مرتبط هستند. با استفاده از نتایج حاصل از این پروژه محققان بیش از ۱۰۰ ناحیه مختلف را از ژنوم کشف کردند که شامل تنوّع‌هایی بودند که به نظر می‌رسید در روی دادن بیماری‌های شایع انسانی مثل دیابت، بیماری عروق کرونر، سرطان سینه و … دخیل هستند. این پروژه تنها به تفاوت‌های بین ژنوم‌ها نگاه می‌کرد زیرا در آن زمان بررسی تمام ژنوم بسیار پرهزینه‌تر بود. با معرفی پروژه ۱۰۰۰ ژنوم، میزان رجوع به منابع پروژه هپ‌مپ کاهش یافت. در پروژه ۱۰۰۰ ژنوم با روش‌های جدیدتر و با کار روی داده‌های بزرگ‌تر و متنوع‌تر توانستیم تا میزان خوبی این روابط را نیز کشف کنیم.[۸]

مطالعه همخوانی سراسر ژنوم[ویرایش]

یکی از کاربردهای کاتالوگ ژنتیکی جدیدی که در پروژه ۱۰۰۰ ژنوم به آن می‌رسیم، مطالعه همخوانی سراسر ژنوم است. در این مطالعه محققانی که به دنبال ناحیه‌هایی از ژنوم هستند که با بیماری یا فنوتیپ خاصی همبستگی داشته باشد، می‌توانند با نگاه‌کردن به این کاتالوگ، تمام تنوّع‌های ناحیهٔ مذکور را بیابند و سپس با طراحی آزمایش‌ها مناسب این همبستگی را بررسی کنند.[۹]

تنوع ژنتیکی در انسان[ویرایش]

از آنجا که پروژه ۱۰۰۰ ژنوم به بررسی تنوّع ژنتیکی انسانی می‌پردازد، شناخت عوامل ایجاد این تنوّع اهمیت زیادی دارد.

چندریختی تک-نوکلئوتیدی[ویرایش]

یک چندریختی تک-نوکلئوتیدی (SNP) تفاوت در یک تک نوکلئوتید در بین اعضا یک جامعه (تک گونه‌ای) است که حداقل در ۱٪ جامعه رخ داده‌است. تخمین زده‌می‌شود که بین ۱۰ تا ۳۰ میلیون چندریختی در انسان موجود باشد.

چندریختی‌ها شایع‌ترین نوع تنوّع رشته‌ای هستند که ۹۰٪ این تنوع را شامل می‌شوند.[۱۰] باقی تنوّع به فرایندهای درج و حذف و جابه‌جایی تک-باز مربوط است.[۱۱]

یک تصویر نمادین از تنوع ژنتیکی انسان

تنوّع ساختاری[ویرایش]

تنوّع ساختاری (Structural Variation) تنوّع در ساختار کروموزوم است. تنوّع‌های ساختاری مانند تنوّع‌های کپی-تعداد، درج‌ها، حذف‌ها و تکرارها عامل بسیار مهمتری نسبت به چندریختی‌ها برای شرح تنوّع ژنتیکی انسان به حساب می‌آیند.[۱۲]

تنوّع کپی-تعداد[ویرایش]

یک تنوّع کپی-تعداد (CNV)، یک تفاوت در ژنوم به دلیل حذف یا تکرار نواحی بزرگی از دی‌اِن‌اِی (DNA) است. تخمین زده می‌شود که ۰٫۴٪ ژنوم افراد غیرخویشاوند به دلیل تنوع کپی-تعداد متمایز است. این تنوع به ارث می‌رسد؛ اما ممکن است در طول زمان نیز به وجود بیاید.[۱۳]

درج و حذف از ژنوم[ویرایش]

عامل دیگری که می‌تواند باعث تنوع ژنتیکی جامعه شود، جهش‌های حذف و درج (indels) از ژنوم‌اند. حذف‌ها جهش‌هایی هستند که یک زیر رشته (خیلی کوچک) از دی ان ای طی فرایند به ارث رسیدن از دست می‌روند. در حالت دیگر ممکن است یک زیررشته به قسمتی دی ان ای اضافه شود و فرایند درج رخ دهد. این دو با ایجاد تغییر در دی ان ای می‌توانند در فرایندهای سلولی تغییر ایجاد کنند. طی تحقیقاتی که انجام شده این نوع جهش‌ها مهم‍ترین عامل تنوع ژنتیکی‌اند.[۱۴]

رانش ژن[ویرایش]

نمونه‌گیری تصادفی از گامت‌ها در زمان تولید مثل جنسی ممکن است باعث رانش ژن (genetic drift) شود و این اتفاق می‌تواند به حذف یک قسمت از تنوع از جامعه گردد. عواملی بیرونی می‌توانند این میزان را کنترل کنند و بعد از مدتی ممکن است جامعه به سمت اجداد خود بازگردد که به این پدیده اثر بانی (founder effect) می‌گویند.[۱۵]

هدف پروژه ۱۰۰۰ ژنوم کشف انواع تنوّع ژنتیکی در یک طیف جامعه‌ای-جغرافیایی است.

شرح پروژه[ویرایش]

یک نقشه جغرافیایی از جوامعی که در نمونه‌گیری‌های ۱۰۰۰ ژنوم حضور دارند.[۱۶]

پروژه ۱۰۰۰ ژنوم قصد داشت، با شناخت طیف جغرافیایی تنوع ژنتیکی انسان، یک مرجع برای تأثیر عوامل ژنتیکی در فنوتیپ و به خصوص بیماری‌ها ارائه کند.

به‌طور دقیق‌تر هدف پروژه ژنوم انسان این بود که بیش‌ترین تفاوت‌های ژنتیکی را که حداقل در ۱ درصد از جوامع حضور داشتند، مطالعه کند. این امر برای این بود تا اطلاعاتی دقیق از چندریختی‌های دی اِن اِی را در جوامع مختلف فراهم شود. نتایج حاصل از این تحقیقات می‌تواند در مطالعه همخوانی سراسر ژنوم مورد استفاده قرار گیرد.

بخش‌های مختلف پروژه[ویرایش]

تحقیق روی ۵ جامعه بزرگ با اجدادی از اروپا، شرق آسیا، جنوب آسیا، غرب آفریقا و آمریکا صورت گرفت. با این کار بیشتر از ۹۵٪ جهش‌های مختلف (مثل کپی‌ها، حذف و درج‌ها و …) کشف شد و همبستگی‌های قسمت‌های مختلف ژنوم مورد بررسی قرار گرفت.[۱]

پروژه آزمایشی[ویرایش]

اولین بخش پروژه، مطالعه آزمایشی شامل سه آزمایش بود: آزمایش با پوشش کم (پایلوت ۱) روی ۱۷۹ نفر از چهار جامعه، آزمایش با پوشش بالا (پایلوت۲) روی دو خانواده سه نفره پدر-مادر-فرزندی و پروژه با هدف اگزون (پایلوت۳) که روی ۶۹۷ نفر از ۷ جامعه کوچک انجام شد. این مرحله توانست مکان، فرکانس آلل و ساختار هپلوتایپ برای تقریباً ۱۵ میلیون چندریختی تک-نوکلئوتیدی، یک میلیون درج و حذف و ۲۰۰۰۰ تفاوت ساختاری را که بیشترشان قبلاً ناشناخته بودند، کشف کند. داده‌های حاصل از این مرحله در سال ۲۰۱۰ در مجله نیچر منتشر شد و در حال حاضر روی وبگاه پروژه قابل استفاده عموم است. داده‌های حاصل از این مطالعه آزمایشی و روش‌های استفاده شده در آن به‌طور شایانی به انجام فازهای بعدی کمک کردند.[۱]

یک تایم‌لاین از مراحل مختلف پروژه ۱۰۰۰ ژنوم

فاز اول[ویرایش]

این فاز از پروژه روی ۱۰۹۲ نفر از ۱۴ زیرجامعه اروپایی، شرق آسیایی، آفریقایی و آمریکایی انجام گرفت و حاصل آن، داده‌های کل ژنوم این افراد بود. تحلیل داده‌ها با روش‌هایی قدرتمند و البته با صرفه اقتصادی انجام شد و توانست تقریباً همه اطلاعات ژنتیکی را به جز چندریختی‌های تک-نوکلئوتیدی نادر و درج و حذف‌های کوچک پیدا کند.[۴]

فاز دوم[ویرایش]

در طول فاز دوم مجموعه داده‌ها به حدود ۱۷۰۰ نمونه گسترش یافت. این داده‌های جدید برای گسترش روش‌ها استفاده شد، هم برای تقویت روش‌های پیشین و هم برای خلق روش‌های جدیدتر تا بتوان ویژگی‌های خاص‌تری مانند چند آللی بودن و تمایزهای ساختاری پیچیده را بررسی کرد.[۱۶]

فاز نهایی[ویرایش]

فاز نهایی که ادامه فازهای قبلی است، شامل بررسی ژنوم ۲۵۰۴ نفر از ۲۶ زیرجامعه مختلف است که در آن تعدادی نمونه آفریقایی اضافه شده‌است. تحلیل داده‌ها با ترکیبی از روش‌های با دقت‌های زیاد و کم که در فاز دوم گسترش یافته‌بودند، انجام شد و در نهایت ۸۸ میلیون تمایز روی ژنوم جوامع یافت شد که شامل ۸۴٫۷ میلیون چندریختی تک-نوکلئوتیدی، ۳٫۶ میلیون حذف و اضافه و ۶۰۰۰۰ تمایز ساختاری است. نتایج این فاز در دو مقاله در سال ۲۰۱۵ چاپ شد یکی در مورد خود پروژه[۵] و یکی در مورد تنوع ساختاری ژنوم.[۳][۱۶]

دسترسی[ویرایش]

پروژه ۱۰۰۰ ژنوم یکی از بزرگترین پروژه‌های جمع‌آوری و تحلیل داده‌است که تا به حال در حوزه زیست‌شناسی انجام شده‌است. علاوه بر اهداف علمی اولیه برای ایجاد یک کاتالوگ جامع از تنوّع ژنتیکی انسان و خلق روش‌های دقیق برای کشف و شناخت این تنوّع، پروژه با انتشار عمومی نتایج تحقیقات، نقش بزرگی را در پیش‌برد تحقیقات زیستی ایفا می‌کند. مسئولین مرکز داده‌های پروژه ابزارهای مختلفی برای دسترسی گسترده به داده‌ها فراهم کرده‌اند.[۱۷]

این شکل یکی از نتایج منتشرشده از فاز نهایی پروژه ۱۰۰۰ ژنوم است که بیانگر تنوع چندریختی در جوامع است.

داده‌های پروژه ۱۰۰۰ ژنوم بدون هیچ محدودیتی و مطابق با آخرین انتشارها در فاز نهایی پروژه در دسترس قرار دارد. در صورت استفاده از داده‌ها محققان باید به پروژه و مقاله مربوطه که شامل معرفی داده‌ها است ارجاع دهند.

تمامی داده‌ها روی وبگاه پروژه[۲] به تفکیک جوامع قرار دارد. این داده‌ها بدون برچسب و مربوط به افراد ناشناس است و هیچ بیماری یا فنوتیپ خاصی به آن‌ها نسبت داده نشده‌است. تمامی افرادی که در پایگاه داده‌ها حاضرند، در زمان نمونه‌گیری خود را سالم معرفی کرده‌اند.[۲]

پایگاه داده‌های مختلفی شامل داده‌های پروژه هستند که از جمله آن‌ها می‌توان به وبسایت مرکز ملی اطالاعات بیوتکنولوژی(NCBI),[۱۸] مرورگر پایلوت[۱۹] و البته مرورگر داده‌های پروژه[۲۰] اشاره کرد. علاوه بر این بسیاری از پایگاه داده‌ها ترکیبی از اطلاعات این پروژه و پروژه‌های دیگر را در خود شامل می‌شوند.[۲۱][۲۲] علاوه بر این راهنماهای زیادی برای دسترسی به داده‌های پروژه نوشته‌شده‌است که به عنوان مثال می‌توان به آموزش‌های موسسه ملی تحقیقات ژنوم انسان اشاره کرد.[۲۳]

چالش‌ها[ویرایش]

چالش‌های اخلاقی[ویرایش]

بحث و جدال‌های زیادی در مورد اخلاقی بودن انتشار داده‌های زیستی روی پایگاه‌داده‌های قابل دسترس عموم و نوع و میزان دسترسی به داده‌ها صورت گرفته‌است. در اتخاذ این تصمیمات باید به موارد مختلفی از جمله میزان اطلاعات منتشر شده، هدف شرکت کنندگان در نمونه‌گیری و نزدیکان آن‌ها و … توجه کرد. هدف بسیاری پروژه‌های بزرگ-مقیاس مانند پروژه ژنوم انسان، پروژه هپ‌مپ، پروژه میکروبیوم انسان و پروژه ۱۰۰۰ ژنوم انتشار عمومی داده‌ها برای بررسی فرضیه‌های تحقیقاتی است، اما باید از نمونه دهنده اجازه گرفته شود تا بتوان داده‌های مربوط به او را منتشر کرد. عموماً در این نوع پروژه‌ها تنها اطلاعات ژنتیکی باید انتشار پیدا کنند زیرا اطلاعات کافی برای بررسی بیماری‌ها و توان کافی برای حفظ حریم شخصی افراد وجود ندارد.[۲۴][۲۵]

از طرف دیگر تهیه و مصرف بودجه درگیر چالش‌های جدی است. برای مثال اگر استفاده از داده‌ها توسط یک شرکت به سود منجر شد، این سود نباید به خیّرینی که در تهیه بودجه سهیم بوده‌اند تعلق گیرد.[۲]

گام‌های پیش رو[ویرایش]

از زمانی که نتایج فاز نهایی پروژه منتشر شده‌است، مرکز هماهنگی داده در آزمایشگاه اروپایی زیست مولکولی همچنان بودجه دریافت می‌کند تا منبع ایجاد شده را نگه‌داری کند و آن را گسترش دهد؛ بنابراین مرجع بین‌المللی نمونه ژنوم[۲] (IGSR) راه‌اندازی شد تا اهداف زیر را دنبال کند:

  • اطمینان حاصل‌کردن از امکان استفاده از داده‌های ۱۰۰۰ ژنوم در آینده
  • متحدکردن نتایج حاصل از تحقیقات بر روی داده‌های پروژه
  • گسترش داده‌ها به گونه‌ای که جوامع بیشتری را دربر گیرد

با پی‌گیری این سه هدف می‌توان ادعا کرد پروژه ۱۰۰۰ ژنوم هنوز هم پایان نیافته و در حال گسترش است.

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. ۱٫۰ ۱٫۱ ۱٫۲ ۱٫۳ «A map of human genome variation from population-scale sequencing». Nature، 28 October 2010. 
  2. ۲٫۰ ۲٫۱ ۲٫۲ ۲٫۳ ۲٫۴ «The International Genome Sample Resource». The International Genome Sample Resource. 
  3. ۳٫۰ ۳٫۱ ۳٫۲ “An integrated map of structural variation in 2,504 human genomes”. Nature (NGP press), 01 October 2015. 
  4. ۴٫۰ ۴٫۱ «An integrated map of genetic variation from 1,092 human genomes». Nature (NPG Press), 01 November 2012. 
  5. ۵٫۰ ۵٫۱ “A global reference for human genetic variation”. Nature (NPG Press), 01 October 2015. 
  6. «Reference genome». wikipedia. 
  7. ۷٫۰ ۷٫۱ Heidi Chial. “DNA Sequencing Technologies Key to the Human Genome Project”. nature (NGP public), 2008. 
  8. ۸٫۰ ۸٫۱ Terwilliger JD1, Hiekkalinna T.. «fundamental theorem of the HapMap». European Journal of Human Genetics (PubMed). 
  9. “International Consortium Announces the 1000 Genomes Project”. NIH. January 22, 2008. 
  10. Collins FS1, Brooks LD, Chakravarti A.. “A DNA polymorphism discovery resource for research on human genetic variation.”. Genome Res (PubMed Central), 1999 Feb;9. 
  11. Philippe E Thomas1,2*, Roman Klinger1 , Laura I Furlong3 , Martin Hofmann-Apitius1 , Christoph M Friedrich1,. “Challenges in the association of human single nucleotide polymorphism mentions with unique database identifiers”. BMC Bioinformatics (BioMed Central), 2011, 12. 
  12. Liza Gross. «A New Human Genome Sequence Paves the Way for Individualized Genomics». PLoS Biology (Public Library of Science)، 2007 Sep 4. doi:https://dx.doi.org/10.1371/journal.pbio.0050266. 
  13. Laura Dumas,1 Young H. Kim,2 Anis Karimpour-Fard,3 Michael Cox,1,4,5 Janet Hopkins,1,4,5 Jonathan R. Pollack,2 and James M. Sikela. «Gene copy number variation spanning 60 million years of human and primate evolution». Genome Res (PubMed Central)، 2007 Sep. doi:https://dx.doi.org/10.1101/gr.6557307. 
  14. Filipe Pereira João Carneiro Rune Matthiesen Barbara van Asch Nádia Pinto Leonor Gusmão António Amorim. «Identification of species by multiplex analysis of variable-length sequences». Nucl Acids Res, 04 October 2010. doi:https://doi.org/10.1093/nar/gkq865. 
  15. Masel J. Genetic drift. doi:10.1016/j.cub.2011.08.007. 
  16. ۱۶٫۰ ۱۶٫۱ ۱۶٫۲ “Providing ongoing support for the 1000 Genomes Project data”. The International Genome Sample Resource. 
  17. Laura Clarke, Xiangqun Zheng-Bradley, Richard Smith, Eugene Kulesha, Chunlin Xiao, Iliana Toneva, Brendan Vaughan, Don Preuss, Rasko Leinonen, Martin Shumway, Stephen Sherry, Paul Flicek & The 1000 Genomes Project Consortium. “The 1000 Genomes Project: data management and community access”. Nature (NGP press), 27 April 2012. 
  18. «1000 Genomes Browser». NCBI. 
  19. «A Deep Catalog of Human Genetic Variation». 1000 genomes pilot. 
  20. «genome browser for vertebrate genomes that supports research in comparative genomics, evolution, sequence variation and transcriptional regulation». Ensemb. 
  21. “allele frequency data on human population samples”. The ALlele FREquency Database. 
  22. «central source, freely available to all, for the storage of allele frequencies from different polymorphic areas in the Human Genome». Allele Frequency Net Database. 
  23. «International Congress of Human Genetics (ICHG) 2011: 1000 Genomes Project Tutorial». National Human Genome Research Institute. 
  24. Amy L. McGuire. «1000 Genomes on the Road to Personalized Medicine». PubMed Central (PubMed)، 2008. 
  25. Marc Via*, Christopher Gignoux and Esteban González Burchard. “The 1000 Genomes Project: new opportunities for research and social challenges”. GenomeMed (BioMed Central), 2010, 2:3. 

پیوند به بیرون[ویرایش]