محتوای سیتوزین-گوانین

از ویکی‌پدیا، دانشنامهٔ آزاد
پیوندهای نوکلئوتیدی که جفت‌های AT و GC را نشان می‌دهند. فلش‌ها به پیوندهای هیدروژنی اشاره می‌کنند.

در زیست‌شناسی مولکولی و ژنتیک محتوای گوانین-سیتوزین، (GC—Content) درصدی از بازهای نوکلئوتیدی از نوع گوانین (G) یا سیتوزین (C) هستند که در ساختار یک مولکول دی‌ان‌ای یا آران‌ای حضور دارند.[۱] این اندازه‌گیری، نسبت بازهای G و C را در مقایسه با بازهای دیگر نشان می‌دهد که شامل آدنین و تیمین در دی‌ان‌ای و آدنین و یوراسیل در آران‌ای است.

محتوای GC ممکن است برای قطعهٔ خاصی از دی‌ان‌ای یا آران‌ای یا برای کل ژنوم محاسبه و گزارش شود.

ساختار[ویرایش]

از نظر کیفی، گوانین (G) و سیتوزین (C) با یک پیوند هیدروژنی خاص در کنار یکدیگر قرار می‌گیرند و آدنین (A) به‌طور خاص با تیمین (T) در دی‌ان‌ای و با یوراسیل (U) در آران‌ای پیوند می‌یابند. از نظر کمی، هر جفت‌باز GC توسط سه پیوند هیدروژنی و جفت‌بازهای AT و AU توسط دو پیوند هیدروژنی در کنار هم نگه داشته می‌شوند. برای تأکید بر این تفاوت، جفت‌بازها اغلب به‌صورت «G≡C» در مقابل «A=T» یا «A=U» نشان داده می‌شوند.

دی‌ان‌ای با محتوای GC بالا نسبت به دی‌ان‌ای با محتوای GC پایین پایدارتر است. با این‌حال، پیوندهای هیدروژنی، خود تأثیر خاصی بر پایداری مولکولی ندارند.[۲] با وجود دماپایداری بالاتری که به یک نوکلئیک اسید با محتوای GC بالا اعطا می‌شود، مشاهده شده‌است که حداقل برخی از گونه‌های باکتری دارای دی‌ان‌ای با محتوای GC بالا با سهولت بیشتری تحت اتولیز قرار می‌گیرند و در نتیجه طول عمر سلول را کاهش می‌دهند.[۳] به‌دلیل پایداری حرارتی جفت‌های GC، زمانی تصور می‌شد که محتوای GC زیاد، یک سازگاری ضروری با دماهای بالا است، اما این فرضیه در سال ۲۰۰۱ رد شد.[۴] با این‌حال، نشان داده شده‌است که یک همبستگی قوی بین رشد بهینهٔ پروکاریوت‌ها در دماهای بالاتر و محتوای GC در آران‌ای‌های ساختاری مانند آران‌ای ریبوزومی آران‌ای حامل و بسیاری از آراِن‌اِی‌های غیر-کدکننده دیگر وجود دارد.[۴][۵] جفت‌بازهای AU پایداری کمتری نسبت به جفت‌بازهای GC دارند و ساختارهای آران‌ای با محتوای GC بالا در برابر اثرات دماهای بالا مقاوم‌تر هستند.

محاسبه[ویرایش]

محتوای GC معمولاً به‌صورت درصد و گاهی نیز به‌صورت نسبتی موسوم به نسبت سیتوزین-گوانین (GC-ratio) بیان می‌شود.

درصد محتوای GC به‌این‌صورت محاسبه می‌شود:[۶]

نسبت AT/GC نیز به‌صورت زیر محاسبه می‌شود:[۷]

درصد محتوا و همچنین نسبت GC را می‌توان با روش‌های مختلفی اندازه‌گیری کرد، اما یکی از ساده‌ترین روش‌ها اندازه‌گیری دمای ذوب مارپیچ دورشته‌ای دی‌اِن‌اِی با استفاده از اسپکتروفتومتری است. میزان جذب دی‌ان‌ای در طول موج ۲۶۰ نانومتر زمانی که مولکول دی‌ان‌ای دورشته‌ای پس از گرم شدن کافی به دو رشتهٔ منفرد جدا می‌شود، به‌شدت افزایش می‌یابد.[۸] رایج‌ترین پروتکل مورد استفاده برای تعیین نسبت GC استفاده از فلو سایتومتری است که برای بررسی تعداد زیادی نمونه استفاده می‌شود.[۹]

در یک روش دیگر، اگر مولکول دی‌ان‌ای یا آران‌ای مورد بررسی، به‌طور قابل‌اعتمادی توالی‌یابی شده باشد، می‌توان محتوای GC را با محاسبه‌ای ساده یا با استفاده از انواع ابزارهای نرم‌افزاری در دسترس عموم، مانند ماشین‌حساب آنلاین رایگان GC به‌طور دقیقی محاسبه کرد.

محتوای ژنومی[ویرایش]

تنوع درون ژنومی[ویرایش]

نسبت GC در یک ژنوم، به‌طور قابل‌توجهی متغیر است. این تغییرات در نسبت GC در ژنوم موجودات پیچیده‌تر منجر به تشکیل حالتی موزائیکی و نواحی جزیره‌ای به‌نام ایزوکور می‌شود.[۱۰] این وضعیت، منجر به تغییرات در شدت رنگ‌آمیزی در کروموزوم‌ها می‌شود.[۱۱] ایزوکورهای غنی از GC معمولاً شامل بسیاری از ژن‌های کدکنندهٔ پروتئین در درون خود می‌شوند؛ بنابراین تعیین نسبت‌های GC در این مناطق خاص، به نگاشت ژن در مناطق غنی از ژن‌ها کمک می‌کند.[۱۲][۱۳]

تنوع ژنوم‌ها[ویرایش]

مشخص شده‌است که محتوای GC در جانداران مختلف، متغیر است.[۱۴]

میانگین محتوای GC در ژنوم انسان از ۳۵ تا ۶۰ درصد در قطعات ۱۰۰ کیلوبازی از دی‌ان‌ای، متغیر است اما میانگین محتوای GC حدود ۴۱ درصد است.[۱۵] محتوای GC در مخمر ساکارومایسس سرویزیه) ۳۸ درصد است[۱۶] و در ارگانیسم مدل، گیاه آرابیدوپسیس تالیانا، ۳۶٪ است.[۱۷] به‌دلیل ماهیت رمزهای ژنتیکی، برای یک جاندار، تقریباً غیرممکن است که ژنومی با محتوای GC نزدیک به صفر یا ۱۰۰ درصد داشته باشد. با این‌حال، گونهٔ پلاسمودیوم فالسیپاروم دارای محتوای سیتوزین-گوانین بسیار پایین و حدود ۲۰ درصد است.[۱۸] به این نمونه‌ها معمولاً با اصطلاحات "غنی از AT" یا "فقیر از GC" اشاره می‌شود.[۱۹]

چندین گونه از پستانداران از تیغ‌پشت‌ها، خفاش‌های کوچک و حشره‌خوارها، افزایش قابل‌توجهی در محتوای GC در ژن‌های خود داشته‌اند. این تغییرات محتوای GC با ویژگی‌های گونه‌های مختلف (به‌عنوان مثال، تودهٔ بدنی یا طول عمر) و اندازهٔ ژنوم،[۲۰] مرتبط است و ممکن است با پدیده‌ای مولکولی به‌نام "تبدیل ژنی وابسته به GC" مرتبط باشد.[۲۱]

ابزارهای نرم‌افزاری[ویرایش]

نرم‌افزارهای GCSpeciesSorter و TopSort ابزارهای نرم‌افزاری برای طبقه‌بندی گونه‌ها بر اساس محتوای GC آن‌ها هستند.[۲۲][۲۳]

منابع[ویرایش]

  1. Definition of GC – content on CancerWeb of Newcastle University,UK
  2. Yakovchuk P, Protozanova E, Frank-Kamenetskii MD (2006). "Base-stacking and base-pairing contributions into thermal stability of the DNA double helix". Nucleic Acids Res. 34 (2): 564–74. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200.
  3. Levin RE, Van Sickle C (1976). "Autolysis of high-GC isolates of Pseudomonas putrefaciens". Antonie van Leeuwenhoek. 42 (1–2): 145–55. doi:10.1007/BF00399459. PMID 7999.
  4. ۴٫۰ ۴٫۱ Hurst LD, Merchant AR (March 2001). "High guanine-cytosine content is not an adaptation to high temperature: a comparative analysis amongst prokaryotes". Proc. Biol. Sci. 268 (1466): 493–7. doi:10.1098/rspb.2000.1397. PMC 1088632. PMID 11296861.
  5. Galtier, N.; Lobry, J.R. (1997). "Relationships between genomic G+C content, RNA secondary structures, and optimal growth temperature in Prokaryotes". Journal of Molecular Evolution. 44 (6): 632–636. Bibcode:1997JMolE..44..632G. doi:10.1007/PL00006186. PMID 9169555.
  6. Madigan,MT. and Martinko JM. (2003). Brock biology of microorganisms (10th ed.). Pearson-Prentice Hall. ISBN 978-84-205-3679-8.
  7. «Definition of GC-ratio on Northwestern University, IL, USA». بایگانی‌شده از اصلی در ۲۰ ژوئن ۲۰۱۰. دریافت‌شده در ۲۹ مه ۲۰۲۲.
  8. Wilhelm J, Pingoud A, Hahn M (May 2003). "Real-time PCR-based method for the estimation of genome sizes". Nucleic Acids Res. 31 (10): e56. doi:10.1093/nar/gng056. PMC 156059. PMID 12736322.
  9. Vinogradov AE (May 1994). "Measurement by flow cytometry of genomic AT/GC ratio and genome size". Cytometry. 16 (1): 34–40. doi:10.1002/cyto.990160106. PMID 7518377.
  10. Bernardi G (January 2000). "Isochores and the evolutionary genomics of vertebrates". Gene. 241 (1): 3–17. doi:10.1016/S0378-1119(99)00485-0. PMID 10607893.
  11. Furey TS, Haussler D (May 2003). "Integration of the cytogenetic map with the draft human genome sequence". Hum. Mol. Genet. 12 (9): 1037–44. doi:10.1093/hmg/ddg113. PMID 12700172.
  12. Sumner AT, de la Torre J, Stuppia L (August 1993). "The distribution of genes on chromosomes: a cytological approach". J. Mol. Evol. 37 (2): 117–22. Bibcode:1993JMolE..37..117S. doi:10.1007/BF02407346. PMID 8411200.
  13. Aïssani B, Bernardi G (October 1991). "CpG islands, genes and isochores in the genomes of vertebrates". Gene. 106 (2): 185–95. doi:10.1016/0378-1119(91)90198-K. PMID 1937049.
  14. Birdsell JA (1 July 2002). "Integrating genomics, bioinformatics, and classical genetics to study the effects of recombination on genome evolution". Mol. Biol. Evol. 19 (7): 1181–97. CiteSeerX 10.1.1.337.1535. doi:10.1093/oxfordjournals.molbev.a004176. PMID 12082137.
  15. International Human Genome Sequencing Consortium (Feb 2001). "Initial sequencing and analysis of the human genome". Nature. 409 (6822): 860–921. Bibcode:2001Natur.409..860L. doi:10.1038/35057062. PMID 11237011. (page 876)
  16. «Saccharomyces cerevisiae S288c (ID 128) - BioProject - NCBI». www.ncbi.nlm.nih.gov. دریافت‌شده در ۲۰۲۲-۰۵-۲۹.
  17. Whole genome data of Arabidopsis thaliana on NCBI
  18. Whole genome data of Plasmodium falciparum on NCBI
  19. Musto H, Cacciò S, Rodríguez-Maseda H, Bernardi G (1997). "Compositional constraints in the extremely GC-poor genome of Plasmodium falciparum" (PDF). Mem. Inst. Oswaldo Cruz. 92 (6): 835–41. doi:10.1590/S0074-02761997000600020. PMID 9566216.
  20. Romiguier, Jonathan; Ranwez, Vincent; Douzery, Emmanuel J. P.; Galtier, Nicolas (2010-08-01). "Contrasting GC-content dynamics across 33 mammalian genomes: Relationship with life-history traits and chromosome sizes". Genome Research (به انگلیسی). 20 (8): 1001–1009. doi:10.1101/gr.104372.109. ISSN 1088-9051. PMC 2909565. PMID 20530252.
  21. Duret L, Galtier N (2009). "Biased gene conversion and the evolution of mammalian genomic landscapes". Annu Rev Genom Hum Genet. 10: 285–311. doi:10.1146/annurev-genom-082908-150001. PMID 19630562.
  22. Karimi K, Wuitchik D, Oldach M, Vize P (2018). "Distinguishing Species Using GC Contents in Mixed DNA or RNA Sequences". Evol Bioinform Online. 14 (January 1, 2018): 1176934318788866. doi:10.1177/1176934318788866. PMC 6052495. PMID 30038485.
  23. Lehnert E, Mouchka M, Burriesci M, Gallo N, Schwarz J, Pringle J (2014). "Extensive differences in gene expression between symbiotic and aposymbiotic cnidarians". G3 (Bethesda). 4 (2): 277–95. doi:10.1534/g3.113.009084. PMC 3931562. PMID 24368779.

پیوند به بیرون[ویرایش]