حاشیه‌نویسی اسنیپ

از ویکی‌پدیا، دانشنامهٔ آزاد
SNP annotation
ClassificationBioinformatics
SubclassificationSingle-nucleotide polymorphism
Type of tools usedFunctional annotation tools
Other subjects relatedGenome project, Genomics

حاشیه‌نویسی پلی مورفیسم تک نوکلئوتیدی(SNP) شامل مراحلی برای پیش‌بینی تأثیر یا عملکرد یک SNP منحصربفرد با استفاده از ابزارهای حاشیه‌نویسی SNP می‌باشد. در حاشیه‌نویسی SNP اطلاعات بیولوژیکی به فرمت صریحی استخراج، جمع‌آوری و نمایش داده می‌شوند که برای انجام پرس و جو مناسب می‌باشد. حاشیه‌نویسی عملکردی SNP براساس اطلاعات قابل دسترس برای اسیدنوکلئیک و توالی پروتئین انجام می‌شود.[۱]

مقدمه[ویرایش]

گراف جهت دار مربوط به ارتباط وب سرورهای پیش بینی SNP و منابع بیوانفورماتیک آنها.[۲]

بخاطر اینکه پلی مورفیسم تک نوکلئوتیدی به عنوان اصلی‌ترین نشانگر زیستی شناخته می‌شود در نتیجه یک نقش اساسی در تحقیقات مرتبط با کل ژنوم ایفا می‌کند. SNPها هم‌اکنون نشانگر قابل انتخاب می‌باشند زیرا که تقریباً در همه جمعیت‌ها به تعداد زیاد وجود دارند. مکان این نشانگرها می‌تواند بشدت برای پیش‌بینی اهمیت کاربردی، نقشه ژنتیکی و ژنتیک جمعیت مهم باشد. هر SNP یک تغییر در نوکلئوتید بین دو فرد در یک مکان مشخص را نشان می‌دهد. SNPها فراگیرترین تغییر ژنتیکی شناخته شده بین افراد هستند به‌طوری که در برخی موجودات هر ۱۰۰–۳۰۰ بیس یک SNP وجود دارد. بخاطر اینکه تعداد زیادی SNP در کل ژنوم وجود دارد پس لازم می‌باشد که SNPها را بر اساس تأثیرات آن‌ها اولیت بندی کرد تا بتوان ژنوتیپ و آنلایز آن‌ها را تسریع بخشید.

حاشیه‌نویسی تعداد زیادی SNP یک فرایند مشکل و پیچیده می‌باشد، که برای پشتیبانی از این حجم عظیم داده نیاز به روش‌های محاسباتی می‌باشد. ابزارهای زیادی برای حاشیه‌نویسی SNP در موجودات مختلف توسعه داده شده و در دسترس هستند، برخی از آن‌ها فقط برای یک موجود خاص بهینه‌سازی شده‌اند و تعداد اندکی نیز می‌باشند که به صورت عمومی طراحی شده‌اند و از داده‌های بدون مدل یک موجود خاص نیز پشتیبانی می‌کنند. بیشتر ابزارهای حاشیه‌نویسی SNP اثرات زیانبار پیش‌بینی شده توسط محاسبات برای SNPها را نمایش می‌دهند. این ابزارها با توجه به مکانی که SNP در آن اتفاق استفاده است مانند اگزون‌ها، محل‌های برش یا محل‌های تنظیمی رونویسی به پیش‌بینی تأثیرات عملکردی مرتبط با آن SNP را با استفاده از الگوریتم‌های گوناگون یادگیری ماشین انجام می‌دهند. اما ابزارها و سیستم‌هایی که به عملکردهای قابل توجه SNPها اولیت می‌دهند دارای محدودیت‌هایی هستند.

انواع حاشیه‌نویسی SNP[ویرایش]

انواع مختلف حاشیه‌نویسی در ژنومیک

برای حاشیه‌نویسی SNP اطلاعات ژنتیکی و ژنومیک زیادی استفاده می‌شود. براساس ویژگی مختلفی که ابزار حاشیه‌نویسی استفاده می‌کند می‌توان این ابزارها را به گروه‌های زیر دسته‌بندی کرد.

حاشیه‌نویسی براساس ژن[ویرایش]

اطلاعات ژنومیک بدست آمده از المان‌های اطراف ژنوم جزو بهترین اطلاعات برای بررسی عملکرد زیستی یک تغییر مشاهده شده هستند. اطلاعات مربوط به یک ژن به عنوان یک منبع برای تشخیص اینکه تغییر مشاهده شده در داخل یا نزدیکی آن ژن می‌باشد استفاده می‌شود و همچنین مشخص می‌کند که آیا آن تغییر پتانسیل برهم زدن توالی یا عملکرد پروتئین ایجاد شده از آن ژن را دارد یا نه. حاشیه‌نویسی براساس ژن بر این اساس است که جهش‌های غیرمترادف می‌توانند توالی پروتئین را تغییر دهند و جهش‌های محل برش می‌توانند الگوهای برش در رونویسی را برهم بزنند.

حاشیه‌نویسی براساس دانش[ویرایش]

حاشیه‌نویسی براساس دانش با استفاده از اطلاعات مربوط به ویژگی‌های ژن، عملکرد و متابولیسم پروتئین انجام می‌شود. در این نوع حاشیه‌نویسی تأکید بیشتری بر تغییرات ژنتیکی است که دامین‌های عملکردی پروتئین، تراکنش پروتئین-پروتئین و گذرگاه‌های بیولوژیکی را برهم می‌زنند. ناحیه غیر-کدشونده از یک ژن شامل عوامل تنظیمی مهمی مانند پروموتر، تقویت‌کننده و جداکننده می‌باشد که می‌تواند عملکرد پروتئین را تغییر دهد. جهش در DNA می‌تواند توالی RNA را تغییر دهد و سپس تأثیر بگذارد بر روی ساختار دوم RNA، تشخیص پروتئین اتصال شونده به RNA و فعالیت‌های اتصال miRNA.

حاشیه‌نویسی وظیفه‌ای[ویرایش]

این روش عملکرد تغییر را براساس اینکه آیا محل تغییر در مکان‌های شناخته شده به عنوان هاربر ژنومیک یا اپی ژنومیک هستند یا خیر. عملکرد تغییرات غیر-کدشونده برای ناحیه ژنومیک تحت تأثیر بسیار وسیع می‌باشد و آن‌ها در بیشتر فرایندهای تنظیمی ژن از رونویسی تا مراحل بعد از رونویسی دخالت دارند.

تنظیم رونویسی ژن[ویرایش]

فرایند تنظیم رونویسی ژن به فاکتورهای فضایی و زمانی زیادی در هسته مانند وضعیت سراسری و محلی کرماتین، موقعیت نوکلزوم، اتصال TF و فعالیت‌های پروموتر بستگی دارد. تغییراتی که باعث عوض شدن عملکرد یکی از این فرایندهای زیسی شود می‌تواند تنظیم ژن را تغییر داده و باعث ایجاد فنوتیپ‌های غیرعادی شود. تغییرات ژنتیکی که در محل‌های کناری تنظیمی ژن رخ می‌دهند می‌تواند اتصال موتیف TF، تنظیم کننده‌های کرماتین را تحت تأثیر قرار دهد که تعامل بین تقویت کننده‌ها و ژن هدف را مختلف می‌کند.

پیرایش جایگزین[ویرایش]

پیرایش جایگزین یکی از مؤلفه‌های مهم می‌باشد که پیچیدگی عملکردی ژنوم را نشان می‌دهد. پیرایش تغییر یافته تأثیر بسزایی در در فنوتیپ‌ها دارد که به متابولیسم بیماری‌ها یا داروها مرتب است. یک تغییر در پیرایش می‌تواند توسط تغییر هر کدام از مؤلفه‌های ماشین پیرایش مانند محل‌های پیرایش و تقویت کننده‌های پیرایش انجام شود. تغییر در محل پیرایش جایگزین می‌تواند به فرم متفاوتی از پروتیئن منجر شود که عملکرد متفاوتی را خواهد داشت. انسان‌ها تقریباً از ۱۰۰ هزار پروتئین متفاوت استفاده می‌کنند، پس باید برخی از ژن توانایی تولید بیش از یک پروتئین را داشته باشند. پیرایش جایگزین بیشتر از آنچه قبلاً تصور می‌شود رخ می‌دهد و کنترل آن بسیار سخت است، ژن‌ها می‌توانند ده‌ها هزار رونوشت متفاوت تولید کنند، که ایجاد یک مدل ژن برای پیرایش‌های جایگزین را لازم می‌کند.

پردازش RNA و تنظیمات بعد از رونویسی[ویرایش]

جهش‌ها در ناحیه‌های ترجمه نشده(UTR) بر روی بیشتر تنظیمات بعد از رونویسی تأثیر می‌گذارند. ویژگی‌های ساختاری متمایز برای بیشتر مولکول‌های RNA و فعالیت‌های المان‌های سیس تنظیمی، لازم می‌باشد تا بتوانند عملکردهای خود را به‌طور تأثیرگذار در طول تنظیم ژن انجام دهند. SNVها می‌توانند ساختار دوم مولکول RNAها را تغییر دهند و فولد مناسب RNA را مختلف کنند.

ترجمه و تغییرات بعد از ترجمه[ویرایش]

تغییر تک نکلوئیدی می‌تواند بر روی فعالیت المان‌های تنظیمی سیس در mRNAها در راستای مهار یا ترویج شروع ترجمه تأثیر بگذارد. تغییر مترادف در ناحیه کدن بخاطر جهش می‌تواند روی راندمان ترجمه تأثیر بگذارد. طول عمر ترجمه نیز می‌تواند توسط جهش در هنگام عبور از پیچ‌های ریبوزم به عقب بیفتد. در مراحل بعد از ترجمه، تغییرات ژنتیکی می‌تواند باعث پروتوئستاز یا تغییرات آمینواسیدی بشود. هرچند مکانیسم‌های تأثیر تغییرات در این زمینه بسیار پیچیده می‌باشد و ابزارهای محدودی برای پیش‌بینی تأثیر تغییرات ژنتیکی بر روی تغییرهای مرتبط با ترجمه در دسترس است.

عملکرد پروتئین[ویرایش]

تغییرات غیرمترادف در اگزون‌ها رخ می‌دهند که توالی امینواسیدی که توسط ژن تولید می‌شود را تغییر می‌دهند، که شامل تغییر یک بیس یا حذف و اضافه‌هایی که باعث تغییر فریم نمی‌شوند است. تأثیر تغییرات غیرمترادف بر روی پروتئین بسیار مورد بررسی قرار گرفته‌است و الگوریتم‌های زیادی برای پیش‌بینی زیان آوری و پاتوژنز تغییرات تک نکلئوتیدی توسعه یافته‌است. ابزارهای کلاسیک بیوانفورماتیک مانند SIFT, Polyphen و Mutation Taster تأثیرات جایگزینی غیرمترادف را به‌درستی پیش‌بینی کرده‌اند.

حفاظت تکاملی و انتخاب طبیعی[ویرایش]

Comparative genomics روش استفاده شد برای پیش‌بینی عملکرد مربوط به انواع تحت این فرض که عملکردی ژنتیکی منبع باید حفظ سراسر گونه‌های مختلف در یک گسترده فیلوژنتیک فاصله است. از سوی دیگر برخی تطبیقی صفات و جمعیت تفاوت رانده مثبت انتخاب سودمند انواع و این جهش‌های ژنتیکی هستند و عملکرد مربوط به جمعیت خاص فنوتیپ. کاربردی پیش‌بینی از انواع' اثر در فرآیندهای مختلف بیولوژیکی محوری به دقت اشاره کردن مکانیسم مولکولی بیماری ها/صفات مستقیم و تجربی اعتبار سنجی.[۳]

لیست ابزارهای حاشیه‌نویسی SNP[ویرایش]

امروزه ابزارهای حاشیه‌نویسی SNP زیادی برای حاشیه‌نویسی تعداد زیادی داده NGS وجود دارد. عملکردها و روش‌های استفاده شده در این ابزارها در جدول زیر آمده‌است.

Tools Description External resources use WebsiteURL References
SNPeff SnpEff annotates variants based on their genomic locations and predicts coding effects. Uses an interval forest approach ENSEMBL, UCSC and organism based e.g. FlyBase, WormBase and TAIR http://snpeff.sourceforge.net/SnpEff_manual.htm[پیوند مرده] .[۴]
VEP Provides the location of specific variants in individuals. Variants are calculated using sanger-style resequencing data dbSNP, Ensembl, UCSC and NCBI http://www.ensembl.org/ .[۵]
ANNOVAR This tool is suitable for pinpointing a small subset of functionally important variants. Uses mutation prediction approach for annotation UCSC, RefSeq and Ensembl https://web.archive.org/web/20181125035022/http://www.openbioinformatics.org/annovar/ .[۶]
Jannovar This is a tool and library for genome annotation RefSeq, Ensembl, UCSC, etc. https://github.com/charite/jannovar [۷]
PhD-SNP SVM-based method using sequence information retrieved by BLAST algorithm. UniRef90 http://snps.biofold.org/phd-snp/ .[۸]
PolyPhen-2 Suitable for predicting damaging effects of missense mutations. Uses sequence conservation, structure to model position of amino acid substitution, and SWISS-PROT annotation UniPort http://genetics.bwh.harvard.edu/pph2/ .[۹]
MutationTaster Suitable for predicting damaging effects of all intragenic mutations (DNA and protein level), including InDels. Ensembl, 1000 Genomes Project, ExAC, UniProt, ClinVar, phyloP, phastCons, nnsplice, polyadq (...) http://www.mutationtaster.org/ .[۱۰]
SuSPect An SVM-trained predictor of the damaging effects of missense mutations. Uses sequence conservation, structure and network (interactome) information to model phenotypic effect of amino acid substitution. Accepts VCF file UniProt, PDB, Phyre2 for predicted structures, DOMINE and STRING for interactome http://www.sbg.bio.ic.ac.uk/suspect/index.html .[۱۱]
F-SNP Computationally predicts functional SNPs for disease association studies. PolyPhen, SIFT, SNPeffect, SNPs3D, LS-SNP, ESEfinder, RescueESE, ESRSearch, PESX, Ensembl, TFSearch, Consite, GoldenPath, Ensembl, KinasePhos, OGPET, Sulfinator, GoldenPath https://web.archive.org/web/20170616142058/http://compbio.cs.queensu.ca/F-SNP/ .[۱۲]
AnnTools Design to Identify novel and SNP/SNV, INDEL and SV/CNV. AnnTools searches for overlaps with regulatory elements, disease/trait associated loci, known segmental duplications and artifact prone regions dbSNP, UCSC, GATK refGene, GAD, published lists of common structural genomic variation, Database of Genomic Variants, lists of conserved TFBs, miRNA http://anntools.sourceforge.net/ .[۱۳]
SNPit Analyses the potential functional significance of SNPs derived from genome wide association studies dbSNP, EntrezGene, UCSC Browser, HGMD, ECR Browser, Haplotter, SIFT -/- .[۱۴]
SCAN Uses physical and functional based annotation to categorize according to their position relative to genes and according to linkage disequilibrium (LD) patterns and effects on expression levels -/- http://www.scandb.org/newinterface/about.html بایگانی‌شده در ۲۲ ژوئن ۲۰۱۷ توسط Wayback Machine .[۱۵]
SNAP A neural network-based method for the prediction of the functional effects of non-synonymous SNPs Ensembl, UCSC, Uniprot, UniProt, Pfam, DAS-CBS, MINT, BIND, KEGG, TreeFam http://www.rostlab.org/services/SNAP .[۱۶]
SNPs&GO SVM-based method using sequence information, Gene Ontology annotation and when available protein structure. UniRef90, GO, PANTHER, PDB http://snps.biofold.org/snps-and-go/ .[۱۷]
LS-SNP Maps nsSNPs onto protein sequences, functional pathways and comparative protein structure models UniProtKB, Genome Browser, dbSNP, PD http://www.salilab.org/LS-SNP .[۱۸]
TREAT TREAT is a tool for facile navigation and mining of the variants from both targeted resequencing and whole exome sequencing -/- http://ndc.mayo.edu/mayo/research/biostat/stand-alone-packages.cfm .[۱۹]
SNPdat Suitable for species non-specific or support non-model organism data. SNPdat does not require the creation of any local relational databases or pre-processing of any mandatory input files -/- https://code.google.com/p/snpdat/downloads/ .[۲۰]
NGS – SNP Annotate SNPs comparing the reference amino acid and the non-reference amino acid to each orthologue Ensembl, NCBI and UniProt https://web.archive.org/web/20170504070752/http://stothard.afns.ualberta.ca/downloads/NGS-SNP/ .[۲۱]
SVA Predicted biological function to variants identified NCBI RefSeq, Ensembl, variation databases, UCSC, HGNC, GO, KEGG, HapMap, 1000 Genomes Project and DG http://www.svaproject.org/ .[۲۲]
VARIANT VARIANT increases the information scope outside the coding regions by including all the available information on regulation, DNA structure, conservation, evolutionary pressures, etc. Regulatory variants constitute a recognized, but still unexplored, cause of pathologies dbSNP,1000 genomes, disease-related variants from GWAS,OMIM, COSMIC http://variant.bioinfo.cipf.es/ بایگانی‌شده در ۲۰ مه ۲۰۱۷ توسط Wayback Machine .[۲۳]
SIFT SIFT is a program that predicts whether an amino acid substitution affects protein function. SIFT uses sequence homology to predict whether an amino acid substitution will affect protein function PROT/TrEMBL, or NCBI's https://archive.today/20130708003130/http://blocks.fhcrc.org/sift/SIFT.html .[۲۴]
FAST-SNP A web server that allows users to efficiently identify and prioritize high-risk SNPs according to their phenotypic risks and putative functional effects NCBI dbSNP, Ensembl, TFSearch, PolyPhen, ESEfinder, RescueESE, FAS-ESS, SwissProt, UCSC Golden Path, NCBI Blast and HapMap https://archive.today/20140810031522/http://fastsnp.ibms.sinica.edu.tw/ .[۲۵]
PANTHER PANTHER relate protein sequence evolution to the evolution of specific protein functions and biological roles. The source of protein sequences used to build the protein family trees and used a computer-assisted manual curation step to better define the protein family clusters STKE, KEGG, MetaCyc, FREX and Reactome http://www.pantherdb.org/ .[۲۶]
Meta-SNP SVM-based meta predictor including 4 different methods. PhD-SNP, PANTHER, SIFT, SNAP http://snps.biofold.org/meta-snp .[۲۷]

الگوریتم‌های استفاده شده در ابزارهای حاشیه‌نویسی[ویرایش]

ابزارهای حاشیه‌نویسی تغییرات از الگوریتم‌های یادگیری ماشین برای پیش‌بینی استفاده می‌کنند. ابزارهای مختلف از الگوریتم‌های مختلف استفاده می‌کنند. الگوریتم‌های معمول عبارتند از:

  • فاصله/جنگل تصادفی-به عنوان مثال.MutPredهای SNPeff
  • شبکه‌های عصبی-به عنوان مثال. ضربه محکم و ناگهانی
  • Support Vector Machines-به عنوان مثال دکترا-SNPهای SNPs و برو
  • بیزی طبقه‌بندی-به عنوان مثال.PolyPhen-2

مقایسه ابزارهای حاشیه‌نویسی تغییرات[ویرایش]

ابزارهای زیادی برای حاشیه‌نویسی تغییرات وجود دارد، ولی در برخی مواقع پیش‌بینی‌های بدست آمده از ابزارها با یکدیگر همخوانی ندارد، زیرا که قوانینی که در ابزارها تعریف شده‌است تفاوت‌های اندکی دارد. مقایسه بی عیب بین ابزارها ممکن نیست زیرا که همه ابزارهای ورودی، خروجی و عملکرد مشابهی ندارند. در جدول زیر ابزارهای اصلی و حوزه کاری آن‌ها آمده‌است:

ابزار فایل ورودی فایل خروجی SNP INDEL CNV وب سایت یا برنامه منبع
AnnoVar VCF pileupهای

CompleteGenomicsهای GFF3-جامد SOAPsnpهای MAQهای CASAVA

TXT بله بله بله برنامه [۲۸]
Jannovar VCF VCF بله بله بله برنامه‌های جاوا [۲۹]
SNPeff VCF pileup/TXT VCF, TXT, HTML بله بله هیچ برنامه [۳۰]
VEP VCF pileupهای HGVSهای

TXT

TXT VCF اچ تی ام ال بله بله هیچ وب/برنامه [۳۱]
AnnTools VCF pileup TXT VCF بله بله هیچ هیچ [۳۲]
SeattleSeq VVCFهای MAQهای CASAVAهای

GATK تخت

VCF SeattleSeq بله بله هیچ وب [۳۳]
نوع VCF GFF2, تخت وب سایت گزارش TXT بله بله بله وب [۳۴]

نتیجه‌گیری[ویرایش]

نصل بعدی وب سرورهای حاشیه‌نویسی SNP می‌توانند از افزایش داده‌ها در بیوانفورماتیک استفاده کنند و داده‌ها را از منابع مختلف در صورت نیاز بدست بیاورند. از دید کاربر بدست آوردن نتایج با استفاده از ارسال SNP در یک گام بسیار کارا می‌باشد.

منابع[ویرایش]

  1. Aubourg, S.; Rouzé, P. (2001). "Genome annotation". Plant Physiol. Biochem. 29: 181–193.
  2. Karchin, Rachel (2009). "Next generation tools for the annotation of human SNPs". Brief Bioinform. 10 (1): 35–52. doi:10.1093/bib/bbn047.
  3. M. J. Li, J. Wang, "Current trend of annotating single nucleotide variation in humans – A case study on SNVrap", Elsevier, 2014, pp. 1–9
  4. Cingolani, P.; Platts, A.; Wang, L. L.; Coon, M.; Nguyen, T.; Wang, L.; Ruden, D. M. (2012). "A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3". Fly. 6 (2): 80–92. doi:10.4161/fly.19695.
  5. Chen Y.; Cunningham F.; Rios D.; McLaren W.M.; Smith J.; Pritchard B.; Spudich G.M.; Brent S.; Kulesha E. (2010). "Ensembl variation resources". BMC Genomics. 11: 293. doi:10.1186/1471-2164-11-293.
  6. Wang K.; Li M.; Hakonarson H. (2010). "ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data". Nucleic Acids Research. 38 (16): e164. doi:10.1093/nar/gkq603. PMC 2938201. PMID 20601685.
  7. Jäger, Marten; Wang, Kai; Bauer, Sebastian; Smedley, Damian; Krawitz, Peter; Robinson, Peter N. (2014-05-01). "Jannovar: a java library for exome annotation". Human Mutation. 35 (5): 548–555. doi:10.1002/humu.22531. ISSN 1098-1004. PMID 24677618.
  8. Capriotti E; Calabrese R; Casadio R. (2006). "Predicting the insurgence of human genetic diseases associated to single point protein mutations with support vector machines and evolutionary information" (PDF). Bioinformatics. 22: 2729–2734. doi:10.1093/bioinformatics/btl423. PMID 16895930.[پیوند مرده]
  9. Adzhubei, I.; Jordan, D.M.; Sunyaev, S.R. (2013). "Predicting functional effect of human missense mutations using PolyPhen-2". Curr Protoc Hum Genet. 7: 20. doi:10.1002/0471142905.hg0720s76.
  10. Schwarz, J.M.; Rodelsperger, C.; Schuelke, M.; Seelow, D. (2010). "MutationTaster evaluates disease-causing potential of sequence alterations". Nat. Methods. 7 (8): 575–576. doi:10.1038/nmeth0810-575. PMID 20676075.
  11. Yates, C. M.; Filippis, I.; Kelley, L. A.; Sternberg, M. J. (2014). "SuSPect: enhanced prediction of single amino acid variant (SAV) phenotype using network features". J Mol Biol. 426: 2692–701. doi:10.1016/j.jmb.2014.04.026. PMC 4087249. PMID 24810707.
  12. Lee, P. H.; Shatkay, H. (2008). "F-SNP: computationally predicted functional SNPs for disease association studies". Nucleic Acids Research. 36: D820–D824. doi:10.1093/nar/gkm904. PMC 2238878. PMID 17986460.
  13. Makarov V.; O'Grady T.; Cai G.; Lihm J.; Buxbaum J. D.; Yoon S. (2012). "AnnTools: a comprehensive and versatile annotation toolkit for genomic variants". Bioinformatics. 28 (5): 724–725. doi:10.1093/bioinformatics/bts032. PMC 3289923. PMID 22257670.
  14. Shen, T. H.; Carlson, C. S.; Tarczy-Hornoch, P. (2009). "SNPit: a federated data integration system for the purpose of functional SNP annotation". Computer Methods and Programs in Biomedicine. 95 (2): 181–189. doi:10.1016/j.cmpb.2009.02.010.
  15. Gamazon E. R.; Zhang W.; Konkashbaev A.; Duan S.; Kistner E. O.; Nicolae D. L.; Cox N. J. (2010). "SCAN: SNP and copy number annotation". Bioinformatics. 26 (2): 259–262. doi:10.1093/bioinformatics/btp644.
  16. Bromberg Y.; Rost B. (2007). "SNAP: predict effect of non-synonymous polymorphisms on function". Nucleic Acids Research. 35 (11): 3823–3835. doi:10.1093/nar/gkm238. PMC 1920242. PMID 17526529.
  17. Calabrese R; Capriotti E; Fariselli P; Martelli PL; Casadio R. (2009). "Functional annotations improve the predictive score of human disease-related mutations in proteins" (PDF). Human Mutation. 30: 1237–1244. doi:10.1002/humu.21047. PMID 19514061.[پیوند مرده]
  18. Karchin, R.; Diekhans, M.; Kelly, L.; Thomas, D.J.; Pieper, U.; Eswar, N.; Haussler, D.; Sali, A. (2005). "LS-SNP: large-scale annotation of coding non-synonymous SNPs based on multiple information sources". Bioinformatics. 21: 2814–2820. doi:10.1093/bioinformatics/bti442. PMID 15827081.
  19. Asmann Y. W.; Middha S.; Hossain A.; Baheti S.; Li Y.; Chai H. -S.; Kocher J. -P. A. (2012). "TREAT: a bioinformatics tool for variant annotations and visualizations in targeted and exome sequencing data". Bioinformatics. 28 (2): 277–278. doi:10.1093/bioinformatics/btr612. PMC 3259432. PMID 22088845.
  20. Doran A. G.; Creevey C. J. (2013). "Snpdat: Easy and rapid annotation of results from de novo snp discovery projects for model and non-model organisms". BMC Bioinformatics. 14: 45. doi:10.1186/1471-2105-14-45. PMC 3574845. PMID 23390980.
  21. Grant J. R.; Arantes A. S.; Liao X.; Stothard P. (2011). "In-depth annotation of SNPs arising from resequencing projects using NGS-SNP". Bioinformatics. 27 (16): 2300–2301. doi:10.1093/bioinformatics/btr372. PMC 3150039. PMID 21697123.
  22. Ge D.; Ruzzo E. K.; Shianna K. V.; He M.; Pelak K.; Heinzen E. L.; Goldstein D. B. (2011). "SVA: software for annotating and visualizing sequenced human genomes". Bioinformatics. 27 (14): 1998–2000. doi:10.1093/bioinformatics/btr317. PMC 3129530. PMID 21624899.
  23. Medina, I.; De Maria, A.; Bleda, M.; Salavert, F.; Alonso, R.; Gonzalez, C. Y.; Dopazo, J. (2012). "VARIANT: Command Line, Web service and Web interface for fast and accurate functional characterization of variants found by Next-Generation Sequencing". Nucleic Acids Research. 40: W54–W58. doi:10.1093/nar/gks572. PMC 3394276. PMID 22693211.
  24. Ng P. C.; Henikoff S. (2003). "SIFT: predicting amino acid changes that affect protein function". Nucleic Acids Research. 31 (13): 3812–3814. doi:10.1093/nar/gkg509.
  25. Yuan, H. -Y.; Chiou, J. -J.; Tseng, W. -H.; Liu, C. -H.; Liu, C. -K.; Lin, Y. -J.; Hsu, C. -N. (2006). "FASTSNP: an always up-to-date and extendable service for SNP function analysis and prioritization". Nucleic Acids Research. 34: W635–W641. doi:10.1093/nar/gkl236. PMC 1538865. PMID 16845089.
  26. Mi, H.; Guo, N.; Kejariwal, A.; Thomas, P. D. (2007). "PANTHER version 6: protein sequence and function evolution data with expanded representation of biological pathways". Nucleic Acids Research. 35: D247–D252. doi:10.1093/nar/gkl869. PMC 1716723. PMID 17130144.
  27. Capriotti E; Altman RB; Bromberg Y. (2013). "Collective judgment predicts disease-associated single nucleotide variants" (PDF). BMC Genomics. 14: S2. doi:10.1186/1471-2164-14-s3-s2. PMC 3839641. PMID 23819846.[پیوند مرده]
  28. Wang, K.; Li, M.; Hakonarson, H. (2010). "ANNOVAR: functional annotation of genetic variants from high-throughput sequencing data". Nucleic Acids Research. 38 (16): e1642012.
  29. "charite/jannovar". GitHub. Retrieved 2016-09-25.
  30. Cingolani, P.; Platts, A.; Wang, L. L.; Coon, M.; Nguyen, T.; Wang, L.; Land, S. J.; Ruden, D. M.; Lu, X. (2012). "A program for annotating and predicting the effects of single nucleotide polymorphisms,SnpEff: SNPs in the genome of Drosophila melanogaster strain w1118; iso-2; iso-3". Fly. 6: 80–92. doi:10.4161/fly.19695.
  31. McLaren, W.; Pritchard, B.; Rios, D.; et al. (2010). "Deriving the consequences of genomic variants with the Ensembl API and SNP effect predictor". Bioinformatics. 26: 2069–70. doi:10.1093/bioinformatics/btq330. PMC 2916720. PMID 20562413. {{cite journal}}: Explicit use of et al. in: |last4= (help)
  32. Makarov, V.; O'Grady, T.; Cai, G.; Lihm, J.; Buxbaum, J. D.; Yoon, S. (2012). "AnnTools: a comprehensive and versatile annotation toolkit for genomic variants". Bioinformatics. 28 (5): 724–5. doi:10.1093/bioinformatics/bts032. PMC 3289923. PMID 22257670.
  33. «نسخه آرشیو شده». بایگانی‌شده از اصلی در ۲۲ سپتامبر ۲۰۱۲. دریافت‌شده در ۲۰ ژوئن ۲۰۱۷.
  34. Medina, I.; Maria, A. De; Bleda, M.; et al. (2012). ",. "VARIANT: command line, web service and web interface for fast and accurate functional characterization of variants found by next-generation sequencing". Nucleic Acids Res. 40: W54–8. doi:10.1093/nar/gks572. PMC 3394276. PMID 22693211. {{cite journal}}: Explicit use of et al. in: |last4= (help)