دسته‌بندی کننده نایو بیز

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

به طور ساده روش بیز روشی برای دسته بندی پدیده‌ها، بر پایه احتمال وقوع یا عدم وقوع یک پدیده‌است.

براساس ویژگی‌های ذاتی احتمال(به ویژه اشتراک احتمال) نایو بیز (به انگلیسی: Naive Bayes classifier) با دریافت تمرین اولیه نتایج خوبی ارایه خواهد کرد. تمرین دادن نایو بیز یک تمرین بانظارت (به انگلیسی: Supervised learning) است.

برای نمونه یک میوه ممکن است پرتغال باشد. اگر نارنجی و کروی با شعاع حدود ده سانتی متر باشد. اگر این احتمالات به درستی به همدیگر وابسته باشند نایو بیز در تخشیص اینکه این میوه پرتغال است یا نه بدرستی عمل خواهد کرد.

برنامه‌های کاربردی بسیاری هستند که پارامترهای نایو بیز را تخمین می‌زنند، بنابر این افراد بدون سروکار داشتن با تئوری بیز می‌توانند از این امکان به منظور حل مسایل مورد نظر بهره ببرند. با وجود مسایل طراحی و پیش فرض‌هایی که در خصوص روش بیز وجود دارد، این روش برای طبقه بندی کردن بیشتر مسایل در جهان واقعی، مناسب است.

مزایا[ویرایش]

تحقیقاتی در سال ۲۰۰۴ دلالیل نظریه‌ای برای رفتارهای غیر منطقی بیز مطرح کرد و همچنین در سال ۲۰۰۶ مشاهدات فراگیری به منظور مقایسه این روش با سایر روش‌های طبقه بندی مانند boosted trees و random forests انجام شد که بر کارا بودن این روش صحه گذاشتند.

بزرگترین ویژگی این روش این است که حجم آموزش اندکی برای شروع کار و تخمین پارامترها نیاز دارد.

منابع[ویرایش]

نرم‌افزارها[ویرایش]

  • IMSL Numerical Libraries Collections of math and statistical algorithms available in C/C++, Fortran, Java and C#/.NET. Data mining routines in the IMSL Libraries include a Naive Bayes classifier.
  • Orange, a free data mining software suite, module orngBayes
  • Winnow content recommendation Open source Naive Bayes text classifier works with very small training and unbalanced training sets. High performance, C, any Unix.
  • Naive Bayes implementation in Visual Basic (includes executable and source code).
  • An interactive مایکروسافت اکسل spreadsheet Naive Bayes implementation using VBA (requires enabled macros) with viewable source code.
  • jBNC - Bayesian Network Classifier Toolbox
  • POPFile Perl-based email proxy system classifies email into user-defined "buckets", including spam.
  • Statistical Pattern Recognition Toolbox for Matlab.
  • sux0r An متن‌باز سامانه مدیریت محتوا with a focus on Naive Bayesian categorization and probabilistic content.
  • ifile - the first freely available (Naive) Bayesian mail/spam filter
  • NClassifier - NClassifier is a.NET library that supports text classification and text summarization. It is a port of the Nick Lothian's popular Java text classification engine, Classifier4J.
  • Classifier4J - Classifier4J is a Java library designed to do text classification. It comes with an implementation of a Bayesian classifier, and now has some other features, including a text summary facility.
  • MALLET - A Java package for document classification and other natural language processing tasks.
  • nBayes - nBayes is an open source.NET library written in C#
  • Apache Mahout - Machine learning package offered by Apache Open Source
  • Weka - Popular open source machine learning package, written in Java
  • C# implementation of Naive Bayes used for documents categorization that includes files processing, stop words filtering and stemming. Same site offers comparison to other algorithms.
  • OpenPR-NB - A C++ implementation of Naive Bayes Classifier. It supports both multinomial and multivariate Bernoulli event model. The maximum likelihood estimate with a Laplace smoothing is used for learning parameters.