پرش به محتوا

حاشیه‌نویسی اسنیپ: تفاوت میان نسخه‌ها

از ویکی‌پدیا، دانشنامهٔ آزاد
محتوای حذف‌شده محتوای افزوده‌شده
M.rasouli (بحث | مشارکت‌ها)
ایجاد شده توسط ترجمهٔ صفحهٔ «SNP annotation»
(بدون تفاوت)

نسخهٔ ‏۲۰ ژوئن ۲۰۱۷، ساعت ۰۲:۰۹

SNP annotation
ClassificationBioinformatics
SubclassificationSingle-nucleotide polymorphism
Type of tools usedFunctional annotation tools
Other subjects relatedGenome project, Genomics

حاشیه نویسی پلی مورفیسم تک نوکلئوتیدی(SNP) شامل مراحلی برای پیش بینی تاثیر یا عملکرد یک SNP منحصربفرد با استفاده از ابزارهای حاشیه نویسی SNP می باشد. در حاشیه نویسی SNP اطلاعات بیولوژیکی به فرمت صریحی استخراج، جمع آوری و نمایش داده می شوند که برای انجام پرس و جو مناسب می باشد. حاشیه نویسی عملکردی SNP براساس اطلاعات قابل دسترس برای اسیدنوکلئیک و توالی پروتئین انجام می شود.[۱]

Introduction

گراف جهت دار مربوط به ارتباط وب سرورهای پیش بینی SNP و منابع بیوانفورماتیک آنها.[۲]

بخاطر اینکه پلی مورفیسم تک نوکلئوتیدی بعنوان اصلیترین نشانگر زیستی شناخته می شود در نتیجه یک نقش اساسی در تحقیقات مرتبط با کل ژنوم ایفا می کند. SNPها هم اکنون نشانگر قابل انتخاب می باشند زیرا که تقریبا در همه جمعیت ها به تعداد زیاد وجود دارند. مکان این نشانگرها می تواند بشدت برای پیش بینی اهمیت کاربردی، نقشه ژنتیکی و ژنتیک جمعیت مهم باشد. هر SNP یک تغییر در نوکلئوتید بین دو فرد در یک مکان مشخص را نشان می دهد. SNPها فراگیرترین تغییر ژنتیکی شناخته شده بین افراد هستند بطوری که در برخی موجودات هر 100-300 بیس یک SNP وجود دارد. بخاطر اینکه تعداد زیادی SNP در کل ژنوم وجود دارد پس لازم می باشد که SNPها را بر اساس تاثیرات آنها اولیت بندی کرد تا بتوان ژنوتیپ و آنلایز آنها را تسریع بخشید.


حاشیه نویسی تعداد زیادی SNP یک فرایند مشکل و پیچیده می باشد، که برای پشتیبانی از این حجم عظیم داده نیاز به روش های محاسباتی می باشد. ابزارهای زیادی برای حاشیه نویسی SNP در موجودات مختلف توسعه داده شده و در دسترس هستند، برخی از آنها فقط برای یک موجود خاص بهینه سازی شده اند و تعداد اندکی نیز می باشند که بصورت عمومی طراحی شده اند و از داده های بدون مدل یک موجود خاص نیز پشتیبانی میکنند. بیشتر ابزارهای حاشیه نویسی SNP اثرات زیانبار پیش بینی شده توسط محاسبات برای SNPها را نمایش می دهند. این ابزارها با توجه به مکانی که SNP در آن اتفاق استفاده است مانند اگزون ها، محل های برش و یا محل های تنظیمی رونویسی به پیش بینی تاثیرات عملکردی مرتبط با آن SNP را با استفاده از الگوریتم های گوناگون یادگیری ماشین انجام می دهند. اما ابزارها و سیستم هایی که به عملکردهای قابل توجه SNPها اولیت می دهند دارای محدودیت هایی هستند.

SNP annotation evidence

انواع مختلف حاشیه نویسی در ژنومیک

برای حاشیه نویسی SNP اطلاعات ژنتیکی و ژنومیک زیادی استفاده می شود. براساس ویژگی مختلفی که ابزار حاشیه نویسی استفاده می کند می توان این ابزارها را به گروه های زیر دسته بندی کرد.

حاشیه نویسی براساس ژن

اطلاعات ژنومیک بدست آمده از المان های اطراف ژنوم جزو بهترین اطلاعات برای بررسی عملکرد زیستی یک تغییر مشاهده شده هستند. اطلاعات مربوط به یک ژن بعنوان یک منبع برای تشخیص اینکه تغییر مشاهده شده در داخل یا نزدیکی آن ژن می باشد استفاده می شود و همچنین مشخص می کند که آیا آن تغییر پتانسیل برهم زدن توالی یا عملکرد پروتئین ایجاد شده از آن ژن را دارد یا نه. حاشیه نویسی براساس ژن بر این اساس است که جهش های غیرمترادف می توانند توالی پروتئین را تغییر دهند و جهش های محل برش می توانند الگوهای برش در رونویسی را برهم بزنند.

حاشیه نویسی براساس دانش

حاشیه نویسی براساس دانش با استفاده از اطلاعات مربوط به ویژگی های ژن، عملکرد و متابولیسم پروتئین انجام می شود. در این نوع حاشیه نویسی تاکید بیشتری بر تغییرات ژنتیکی است که دامین های عملکردی پروتئین، تراکنش پروتئین-پروتئین و گذرگاه های بیولوژیکی را برهم می زنند. ناحیه غیر-کدشونده از یک ژن شامل عوامل تنظیمی مهمی مانند پروموتر، تقویت کننده و جداکننده می باشد که می تواند عملکرد پروتئین را تغییر دهد. جهش در DNA میتواند توالی RNA را تغییر دهد و سپس تاثیر بگذارد بر روی ساختار دوم RNA، تشخیص پروتئین اتصال شونده به RNA و فعالیت های اتصال miRNA.

حاشیه نویسی وظیفه ای

این روش عملکرد تغییر را براساس اینکه آیا محل تغییر در مکان های شناخته شده بعنوان هاربر ژنومیک و یا اپی ژنومیک هستند یا خیر. عملکرد تغییرات غیر-کدشونده برای ناحیه ژنومیک تحت تاثیر بسیار وسیع می باشد و آنها در بیشتر فرایند های تنظیمی ژن از رونویسی تا مراحل بعد از رونویسی دخالت دارند.

تنظیم رونویسی ژن

فرایند تنظیم رونویسی ژن به فاکتورهای فضایی و زمانی زیادی  در هسته مانند وضعیت سراسری و محلی کرماتین، موقعیت نوکلزوم، اتصال TF و فعالیت های پروموتر بستگی دارد. تغییراتی که باعث عوض شدن عملکرد یکی از این فرایندهای زیسی شود می تواند تنظیم ژن را تغییر داده و باعث ایجاد فنوتیپ های غیرعادی شود. تغییرات ژنتیکی که در محل های کناری تنظیمی ژن رخ می دهند می تواند اتصال موتیف TF، تنظیم کننده های کرماتین را تحت تاثیر قرار دهد که تعامل بین تقویت کننده ها و ژن هدف را مختلف میکند.

پیرایش جایگزین

پیرایش جایگزین یکی از مولفه های مهم می باشد که پیچیدگی عملکردی ژنوم را نشان می دهد. پیرایش تغییر یافته تاثیر بسزایی در در فنوتیپ ها دارد که به متابولیسم بیماری ها یا داروها مرتب است. یک تغییر در پیرایش می تواند توسط تغییر هر کدام از مولفه های ماشین پیرایش مانند محل های پیرایش و تقویت کننده های پیرایش انجام شود. تغییر در محل پیرایش جایگزین می تواند به فرم متفاوتی از پروتیئن منجر شود که عملکرد متفاوتی را خواهد داشت. انسان ها تقریبا از 100 هزار پروتئین متفاوت استفاده می کنند، پس باید برخی از ژن توانایی تولید بیش از یک پروتئین را داشته باشند. پیرایش جایگزین بیشتر از آنچه قبلا تصور می شود رخ می دهد و کنترل آن بسیار سخت است، ژن ها می توانند ده ها هزار رونوشت متفاوت تولید کنند، که ایجاد یک مدل ژن برای پیرایش های جایگزین را لازم می کند.

پردازش RNA و تنظیمات بعد از رونویسی

جهش ها در ناحیه های ترجمه نشده(UTR) بر روی بیشتر تنظیمات بعد از رونویسی تاثیر می گذارند. ویژگی های ساختاری متمایز برای بیشتر مولکول های RNA و فعالیت های المان های سیس تنظیمی، لازم می باشد تا بتوانند عملکردهای خود را بطور تاثیرگذار در طول تنظیم ژن انجام دهند. SNVها می توانند ساختار دوم مولکول RNAها را تغییر دهند و فولد مناسب RNA را مختلف کنند.

ترجمه و تغییرات بعد از ترجمه

تغییر تک نکلوئیدی می تواند بر روی فعالیت المان های تنظیمی سیس در mRNAها در راستای مهار یا ترویج شروع ترجمه تاثیر بگذارد. تغییر مترادف  در ناحیه کدن بخاطر جهش می تواند روی راندمان ترجمه تاثیر بگذارد. طول عمر ترجمه نیز می تواند توسط جهش در هنگام عبور از پیچ های ریبوزم به عقب بیفتد. در مراحل بعد از ترجمه، تغییرات ژنتیکی می تواند باعث پروتوئستاز و یا تغییرات آمینواسیدی بشود. هرچند مکانیسم های تاثیر تغییرات در این زمینه بسیار پیچیده می باشد و ابزارهای محدودی برای پیش بینی تاثیر تغییرات ژنتیکی بر روی تغییرهای مرتبط با ترجمه در دسترس است.

عملکرد پروتئین

تغییرات غیرمترادف در اگزون ها رخ می دهند که توالی امینواسیدی که توسط ژن تولید می شود را تغییر می دهند، که شامل تغییر یک بیس و یا حذف و اضافه هایی که باعث تغییر فریم نمی شوند است. تاثیر تغییرات غیرمترادف برروی پروتئین بسیار مورد بررسی قرار گرفته است و الگوریتم های زیادی برای پیش بینی زیان آوری و پاتوژنز تغییرات تک نکلئوتیدی توسعه یافته است. ابزارهای کلاسیک بیوانفورماتیک مانند SIFT، Polyphen و Mutation Taster تاثیرات جایگزینی غیرمترادف را بدرستی پیش بینی کرده اند.

حفاظت تکاملی و انتخاب طبیعی

Comparative genomics روش استفاده شد برای پیش بینی عملکرد مربوط به انواع تحت این فرض که عملکردی ژنتیکی منبع باید حفظ سراسر گونه های مختلف در یک گسترده فیلوژنتیک فاصله است. از سوی دیگر برخی تطبیقی صفات و جمعیت تفاوت رانده مثبت انتخاب سودمند انواع و این جهش های ژنتیکی هستند و عملکرد مربوط به جمعیت خاص فنوتیپ. کاربردی پیش بینی از انواع' اثر در فرآیندهای مختلف بیولوژیکی محوری به دقت اشاره کردن مکانیسم مولکولی بیماری ها/صفات مستقیم و تجربی اعتبار سنجی.[۳]

لیست ابزارهای حاشیه نویسی SNP

امروزه ابزارهای حاشیه نویسی SNP زیادی برای حاشیه نویسی تعداد زیادی داده NGS وجود دارد. عملکردها و روش های استفاده شده در این ابزارها در جدول زیر آمده است.

Tools Description External resources use WebsiteURL References
SNPeff SnpEff annotates variants based on their genomic locations and predicts coding effects. Uses an interval forest approach ENSEMBL, UCSC and organism based e.g. FlyBase, WormBase and TAIR http://snpeff.sourceforge.net/SnpEff_manual.htm .[۴]
VEP Provides the location of specific variants in individuals. Variants are calculated using sanger-style resequencing data dbSNP, Ensembl, UCSC and NCBI http://www.ensembl.org/ .[۵]
ANNOVAR This tool is suitable for pinpointing a small subset of functionally important variants. Uses mutation prediction approach for annotation UCSC, RefSeq and Ensembl http://www.openbioinformatics.org/annovar/ .[۶]
Jannovar This is a tool and library for genome annotation RefSeq, Ensembl, UCSC, etc. https://github.com/charite/jannovar [۷]
PhD-SNP SVM-based method using sequence information retrieved by BLAST algorithm. UniRef90 http://snps.biofold.org/phd-snp/ .

[۸]

PolyPhen-2 Suitable for predicting damaging effects of missense mutations. Uses sequence conservation, structure to model position of amino acid substitution, and SWISS-PROT annotation UniPort http://genetics.bwh.harvard.edu/pph2/ .[۹]
MutationTaster Suitable for predicting damaging effects of all intragenic mutations (DNA and protein level), including InDels. Ensembl, 1000 Genomes Project, ExAC, UniProt, ClinVar, phyloP, phastCons, nnsplice, polyadq (...) http://www.mutationtaster.org/ .[۱۰]
SuSPect An SVM-trained predictor of the damaging effects of missense mutations. Uses sequence conservation, structure and network (interactome) information to model phenotypic effect of amino acid substitution. Accepts VCF file UniProt, PDB, Phyre2 for predicted structures, DOMINE and STRING for interactome http://www.sbg.bio.ic.ac.uk/suspect/index.html .[۱۱]
F-SNP Computationally predicts functional SNPs for disease association studies. PolyPhen, SIFT, SNPeffect, SNPs3D, LS-SNP, ESEfinder, RescueESE, ESRSearch, PESX, Ensembl, TFSearch, Consite, GoldenPath, Ensembl, KinasePhos, OGPET, Sulfinator, GoldenPath http://compbio.cs.queensu.ca/F-SNP/ .[۱۲]
AnnTools Design to Identify novel and SNP/SNV, INDEL and SV/CNV. AnnTools searches for overlaps with regulatory elements, disease/trait associated loci, known segmental duplications and artifact prone regions dbSNP, UCSC, GATK refGene, GAD, published lists of common structural genomic variation, Database of Genomic Variants, lists of conserved TFBs, miRNA http://anntools.sourceforge.net/ .[۱۳]
SNPit Analyses the potential functional significance of SNPs derived from genome wide association studies dbSNP, EntrezGene, UCSC Browser, HGMD, ECR Browser, Haplotter, SIFT -/- .[۱۴]
SCAN Uses physical and functional based annotation to categorize according to their position relative to genes and according to linkage disequilibrium (LD) patterns and effects on expression levels -/- http://www.scandb.org/newinterface/about.html .[۱۵]
SNAP A neural network-based method for the prediction of the functional effects of non-synonymous SNPs Ensembl, UCSC, Uniprot, UniProt, Pfam, DAS-CBS, MINT, BIND, KEGG, TreeFam http://www.rostlab.org/services/SNAP .[۱۶]
SNPs&GO SVM-based method using sequence information, Gene Ontology annotation and when available protein structure. UniRef90, GO, PANTHER, PDB http://snps.biofold.org/snps-and-go/ .

[۱۷]

LS-SNP Maps nsSNPs onto protein sequences, functional pathways and comparative protein structure models UniProtKB, Genome Browser, dbSNP, PD http://www.salilab.org/LS-SNP .[۱۸]
TREAT TREAT is a tool for facile navigation and mining of the variants from both targeted resequencing and whole exome sequencing -/- http://ndc.mayo.edu/mayo/research/biostat/stand-alone-packages.cfm .[۱۹]
SNPdat Suitable for species non-specific or support non-model organism data. SNPdat does not require the creation of any local relational databases or pre-processing of any mandatory input files -/- https://code.google.com/p/snpdat/downloads/ .[۲۰]
NGS – SNP Annotate SNPs comparing the reference amino acid and the non-reference amino acid to each orthologue Ensembl, NCBI and UniProt http://stothard.afns.ualberta.ca/downloads/NGS-SNP/ .[۲۱]
SVA Predicted biological function to variants identified NCBI RefSeq, Ensembl, variation databases, UCSC, HGNC, GO, KEGG, HapMap, 1000 Genomes Project and DG http://www.svaproject.org/ .[۲۲]
VARIANT VARIANT increases the information scope outside the coding regions by including all the available information on regulation, DNA structure, conservation, evolutionary pressures, etc. Regulatory variants constitute a recognized, but still unexplored, cause of pathologies dbSNP,1000 genomes, disease-related variants from GWAS,OMIM, COSMIC http://variant.bioinfo.cipf.es/ .[۲۳]
SIFT SIFT is a program that predicts whether an amino acid substitution affects protein function. SIFT uses sequence homology to predict whether an amino acid substitution will affect protein function PROT/TrEMBL, or NCBI's http://blocks.fhcrc.org/sift/SIFT.html .[۲۴]
FAST-SNP A web server that allows users to efficiently identify and prioritize high-risk SNPs according to their phenotypic risks and putative functional effects NCBI dbSNP, Ensembl, TFSearch, PolyPhen, ESEfinder, RescueESE, FAS-ESS, SwissProt, UCSC Golden Path, NCBI Blast and HapMap http://fastsnp.ibms.sinica.edu.tw/ .[۲۵]
PANTHER PANTHER relate protein sequence evolution to the evolution of specific protein functions and biological roles. The source of protein sequences used to build the protein family trees and used a computer-assisted manual curation step to better define the protein family clusters STKE, KEGG, MetaCyc, FREX and Reactome http://www.pantherdb.org/ .[۲۶]
Meta-SNP SVM-based meta predictor including 4 different methods. PhD-SNP, PANTHER, SIFT, SNAP http://snps.biofold.org/meta-snp .

[۲۷]

الگوریتم های استفاده شده در ابزارهای حاشیه نویسی

ابزارهای حاشیه نویسی تغییرات از الگوریتم های یادگیری ماشین برای پیش بینی استفاده می کنند. ابزارهای مختلف از الگوریتم های مختلف استفاده میکنند. الگوریتم های معمول عبارتند از:

  • فاصله/جنگل تصادفی-به عنوان مثال.MutPred های SNPeff
  • شبکه های عصبی-به عنوان مثال.ضربه محکم و ناگهانی
  • Support Vector Machines-به عنوان مثال دکترا-SNP های SNPs و برو
  • بیزی طبقه بندی-به عنوان مثال.PolyPhen-2

مقایسه ابزارهای حاشیه نویسی تغییرات

ابزارهای زیادی برای حاشیه نویسی تغییرات وجود دارد، ولی در برخی مواقع پیش بینی های بدست آمده از ابزارها با یکدیگر همخوانی ندارد، زیرا که قوانینی که در ابزارها تعریف شده است تفاوت های اندکی دارد. مقایسه بی عیب بین ابزارها ممکن نیست زیرا که همه ابزارهای ورودی، خروجی و عملکرد مشابهی ندارند. در جدول زیر ابزارهای اصلی و حوزه کاری آنها آمده است:

ابزار فایل ورودی فایل خروجی SNP INDEL CNV وب سایت و یا برنامه منبع
AnnoVar VCF pileup های

CompleteGenomics های GFF3-جامد SOAPsnp های MAQ های CASAVA

TXT بله بله بله برنامه [۲۸]
Jannovar VCF VCF بله بله بله برنامه های جاوا [۲۹]
SNPeff VCF pileup/TXT VCF, TXT, HTML بله بله هیچ برنامه [۳۰]
VEP VCF pileup های HGVS های

TXT

TXT VCF اچ تی ام ال بله بله هیچ وب/برنامه [۳۱]
AnnTools VCF pileup TXT VCF بله بله هیچ هیچ [۳۲]
SeattleSeq VVCF های MAQ های CASAVA های

GATK تخت

VCF SeattleSeq بله بله هیچ وب [۳۳]
نوع VCF GFF2, تخت وب سایت گزارش TXT بله بله بله وب [۳۴]

نتیجه گیری

نصل بعدی وب سرور های حاشیه نویسی SNP می توانند از افزایش داده ها در بیوانفورماتیک استفاده کنند و داده ها را از منابع مختلف در صورت نیاز بدست بیاورند. از دید کاربر بدست آوردن نتایج با استفاده از ارسال SNP در یک گام بسیار کارا می باشد.

References

  1. Aubourg, S.; Rouzé, P. (2001). "Genome annotation". Plant Physiol. Biochem. 29: 181–193.
  2. Karchin, Rachel (2009). "Next generation tools for the annotation of human SNPs". Brief Bioinform. 10 (1): 35–52. doi:10.1093/bib/bbn047.
  3. M. J. Li, J. Wang, "Current trend of annotating single nucleotide variation in humans – A case study on SNVrap", Elsevier, 2014, pp. 1–9
  4. Cingolani, P.; Platts, A.; Wang, L. L.; Coon, M.; Nguyen, T.; Wang, L.; Ruden, D. M. (2012). "A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3". Fly. 6 (2): 80–92. doi:10.4161/fly.19695.
  5. Chen Y.; Cunningham F.; Rios D.; McLaren W.M.; Smith J.; Pritchard B.; Spudich G.M.; Brent S.; Kulesha E. (2010). "Ensembl variation resources". BMC Genomics. 11: 293. doi:10.1186/1471-2164-11-293.
  6. Wang K.; Li M.; Hakonarson H. (2010). "ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data". Nucleic Acids Research. 38 (16): e164. doi:10.1093/nar/gkq603. PMC 2938201. PMID 20601685.
  7. Jäger, Marten; Wang, Kai; Bauer, Sebastian; Smedley, Damian; Krawitz, Peter; Robinson, Peter N. (2014-05-01). "Jannovar: a java library for exome annotation". Human Mutation. 35 (5): 548–555. doi:10.1002/humu.22531. ISSN 1098-1004. PMID 24677618.
  8. Capriotti E; Calabrese R; Casadio R. (2006). "Predicting the insurgence of human genetic diseases associated to single point protein mutations with support vector machines and evolutionary information" (PDF). Bioinformatics. 22: 2729–2734. doi:10.1093/bioinformatics/btl423. PMID 16895930.
  9. Adzhubei, I.; Jordan, D.M.; Sunyaev, S.R. (2013). "Predicting functional effect of human missense mutations using PolyPhen-2". Curr Protoc Hum Genet. 7: 20. doi:10.1002/0471142905.hg0720s76.
  10. Schwarz, J.M.; Rodelsperger, C.; Schuelke, M.; Seelow, D. (2010). "MutationTaster evaluates disease-causing potential of sequence alterations". Nat. Methods. 7 (8): 575–576. doi:10.1038/nmeth0810-575. PMID 20676075.
  11. Yates, C. M.; Filippis, I.; Kelley, L. A.; Sternberg, M. J. (2014). "SuSPect: enhanced prediction of single amino acid variant (SAV) phenotype using network features". J Mol Biol. 426: 2692–701. doi:10.1016/j.jmb.2014.04.026. PMC 4087249. PMID 24810707.
  12. Lee, P. H.; Shatkay, H. (2008). "F-SNP: computationally predicted functional SNPs for disease association studies". Nucleic Acids Research. 36: D820–D824. doi:10.1093/nar/gkm904. PMC 2238878. PMID 17986460.
  13. Makarov V.; O'Grady T.; Cai G.; Lihm J.; Buxbaum J. D.; Yoon S. (2012). "AnnTools: a comprehensive and versatile annotation toolkit for genomic variants". Bioinformatics. 28 (5): 724–725. doi:10.1093/bioinformatics/bts032. PMC 3289923. PMID 22257670.
  14. Shen, T. H.; Carlson, C. S.; Tarczy-Hornoch, P. (2009). "SNPit: a federated data integration system for the purpose of functional SNP annotation". Computer Methods and Programs in Biomedicine. 95 (2): 181–189. doi:10.1016/j.cmpb.2009.02.010.
  15. Gamazon E. R.; Zhang W.; Konkashbaev A.; Duan S.; Kistner E. O.; Nicolae D. L.; Cox N. J. (2010). "SCAN: SNP and copy number annotation". Bioinformatics. 26 (2): 259–262. doi:10.1093/bioinformatics/btp644.
  16. Bromberg Y.; Rost B. (2007). "SNAP: predict effect of non-synonymous polymorphisms on function". Nucleic Acids Research. 35 (11): 3823–3835. doi:10.1093/nar/gkm238. PMC 1920242. PMID 17526529.
  17. Calabrese R; Capriotti E; Fariselli P; Martelli PL; Casadio R. (2009). "Functional annotations improve the predictive score of human disease-related mutations in proteins" (PDF). Human Mutation. 30: 1237–1244. doi:10.1002/humu.21047. PMID 19514061.
  18. Karchin, R.; Diekhans, M.; Kelly, L.; Thomas, D.J.; Pieper, U.; Eswar, N.; Haussler, D.; Sali, A. (2005). "LS-SNP: large-scale annotation of coding non-synonymous SNPs based on multiple information sources". Bioinformatics. 21: 2814–2820. doi:10.1093/bioinformatics/bti442. PMID 15827081.
  19. Asmann Y. W.; Middha S.; Hossain A.; Baheti S.; Li Y.; Chai H.-S.; Kocher J.-P. A. (2012). "TREAT: a bioinformatics tool for variant annotations and visualizations in targeted and exome sequencing data". Bioinformatics. 28 (2): 277–278. doi:10.1093/bioinformatics/btr612. PMC 3259432. PMID 22088845.
  20. Doran A. G.; Creevey C. J. (2013). "Snpdat: Easy and rapid annotation of results from de novo snp discovery projects for model and non-model organisms". BMC Bioinformatics. 14: 45. doi:10.1186/1471-2105-14-45. PMC 3574845. PMID 23390980.
  21. Grant J. R.; Arantes A. S.; Liao X.; Stothard P. (2011). "In-depth annotation of SNPs arising from resequencing projects using NGS-SNP". Bioinformatics. 27 (16): 2300–2301. doi:10.1093/bioinformatics/btr372. PMC 3150039. PMID 21697123.
  22. Ge D.; Ruzzo E. K.; Shianna K. V.; He M.; Pelak K.; Heinzen E. L.; Goldstein D. B. (2011). "SVA: software for annotating and visualizing sequenced human genomes". Bioinformatics. 27 (14): 1998–2000. doi:10.1093/bioinformatics/btr317. PMC 3129530. PMID 21624899.
  23. Medina, I.; De Maria, A.; Bleda, M.; Salavert, F.; Alonso, R.; Gonzalez, C. Y.; Dopazo, J. (2012). "VARIANT: Command Line, Web service and Web interface for fast and accurate functional characterization of variants found by Next-Generation Sequencing". Nucleic Acids Research. 40: W54–W58. doi:10.1093/nar/gks572. PMC 3394276. PMID 22693211.
  24. Ng P. C.; Henikoff S. (2003). "SIFT: predicting amino acid changes that affect protein function". Nucleic Acids Research. 31 (13): 3812–3814. doi:10.1093/nar/gkg509.
  25. Yuan, H.-Y.; Chiou, J.-J.; Tseng, W.-H.; Liu, C.-H.; Liu, C.-K.; Lin, Y.-J.; Hsu, C.-N. (2006). "FASTSNP: an always up-to-date and extendable service for SNP function analysis and prioritization". Nucleic Acids Research. 34: W635–W641. doi:10.1093/nar/gkl236. PMC 1538865. PMID 16845089.
  26. Mi, H.; Guo, N.; Kejariwal, A.; Thomas, P. D. (2007). "PANTHER version 6: protein sequence and function evolution data with expanded representation of biological pathways". Nucleic Acids Research. 35: D247–D252. doi:10.1093/nar/gkl869. PMC 1716723. PMID 17130144.
  27. Capriotti E; Altman RB; Bromberg Y. (2013). "Collective judgment predicts disease-associated single nucleotide variants" (PDF). BMC Genomics. 14: S2. doi:10.1186/1471-2164-14-s3-s2. PMC 3839641. PMID 23819846.
  28. Wang, K.; Li, M.; Hakonarson, H. (2010). "ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data". Nucleic Acids Research. 38 (16): e1642012.
  29. "charite/jannovar". GitHub. Retrieved 2016-09-25.
  30. Cingolani, P.; Platts, A.; Wang, L. L.; Coon, M.; Nguyen, T.; Wang, L.; Land, S. J.; Ruden, D. M.; Lu, X. (2012). "A program for annotating and predicting the effects of single nucleotide polymorphisms,SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3". Fly. 6: 80–92. doi:10.4161/fly.19695.
  31. McLaren, W.; Pritchard, B.; Rios, D.; et al. (2010). "Deriving the consequences of genomic variants with the Ensembl API and SNP effect predictor". Bioinformatics. 26: 2069–70. doi:10.1093/bioinformatics/btq330. PMC 2916720. PMID 20562413. {{cite journal}}: Explicit use of et al. in: |last4= (help)
  32. Makarov, V.; O'Grady, T.; Cai, G.; Lihm, J.; Buxbaum, J. D.; Yoon, S. (2012). "AnnTools: a comprehensive and versatile annotation toolkit for genomic variants". Bioinformatics. 28 (5): 724–5. doi:10.1093/bioinformatics/bts032. PMC 3289923. PMID 22257670.
  33. http://snp.gs.washington.edu/SeattleSeqAnnotation
  34. Medina, I.; Maria, A. De; Bleda, M.; et al. (2012). ",. "VARIANT: command line, web service and web interface for fast and accurate functional characterization of variants found by next-generation sequencing". Nucleic Acids Res. 40: W54–8. doi:10.1093/nar/gks572. PMC 3394276. PMID 22693211. {{cite journal}}: Explicit use of et al. in: |last4= (help)