دستهبندی کننده نایو بیز
|
|
این مقاله نیازمند تمیزکاری است. لطفاً تا جای امکان آنرا از نظر املا، انشا، چیدمان و درستی بهتر کنید، سپس این الگو را از بالای مقاله بردارید. محتویات این مقاله ممکن است غیر قابل اعتماد و نادرست یا جانبدارانه باشد یا قوانین حقوق پدیدآورندگان را نقض کرده باشد. |
به طور ساده روش بیز روشی برای دسته بندی پدیدهها، بر پایه احتمال وقوع یا عدم وقوع یک پدیدهاست.
براساس ویژگیهای ذاتی احتمال(به ویژه اشتراک احتمال) نایو بیز (به انگلیسی: Naive Bayes classifier) با دریافت تمرین اولیه نتایج خوبی ارایه خواهد کرد. تمرین دادن نایو بیز یک تمرین بانظارت (به انگلیسی: Supervised learning) است.
برای نمونه یک میوه ممکن است پرتغال باشد. اگر نارنجی و کروی با شعاع حدود ده سانتی متر باشد. اگر این احتمالات به درستی به همدیگر وابسته باشند نایو بیز در تخشیص اینکه این میوه پرتغال است یا نه بدرستی عمل خواهد کرد.
برنامههای کاربردی بسیاری هستند که پارامترهای نایو بیز را تخمین میزنند، بنابر این افراد بدون سروکار داشتن با تئوری بیز میتوانند از این امکان به منظور حل مسایل مورد نظر بهره ببرند. با وجود مسایل طراحی و پیش فرضهایی که در خصوص روش بیز وجود دارد، این روش برای طبقه بندی کردن بیشتر مسایل در جهان واقعی، مناسب است.
مزایا [ویرایش]
تحقیقاتی در سال ۲۰۰۴ دلالیل نظریهای برای رفتارهای غیر منطقی بیز مطرح کرد و همچنین در سال ۲۰۰۶ مشاهدات فراگیری به منظور مقایسه این روش با سایر روشهای طبقه بندی مانند boosted trees و random forests انجام شد که بر کارا بودن این روش صحه گذاشتند.
بزرگترین ویژگی این روش این است که حجم آموزش اندکی برای شروع کار و تخمین پارامترها نیاز دارد.
منبع [ویرایش]
- مشارکتکنندگان ویکیپدیا، «Naive Bayes classifier»، ویکیپدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۱ ژوئن ۲۰۱۲).
- Book Chapter: Naive Bayes text classification, Introduction to Information Retrieval
- Naive Bayes for Text Classification with Unbalanced Classes
- Benchmark results of Naive Bayes implementations
- Hierarchical Naive Bayes Classifiers for uncertain data (an extension of the Naive Bayes classifier).
نرم افزارها [ویرایش]
- IMSL Numerical Libraries Collections of math and statistical algorithms available in C/C++, Fortran, Java and C#/.NET. Data mining routines in the IMSL Libraries include a Naive Bayes classifier.
- Orange, a free data mining software suite, module orngBayes
- Winnow content recommendation Open source Naive Bayes text classifier works with very small training and unbalanced training sets. High performance, C, any Unix.
- Naive Bayes implementation in Visual Basic (includes executable and source code).
- An interactive مایکروسافت اکسل spreadsheet Naive Bayes implementation using VBA (requires enabled macros) with viewable source code.
- jBNC - Bayesian Network Classifier Toolbox
- POPFile Perl-based email proxy system classifies email into user-defined "buckets", including spam.
- Statistical Pattern Recognition Toolbox for Matlab.
- sux0r An متنباز سامانه مدیریت محتوا with a focus on Naive Bayesian categorization and probabilistic content.
- ifile - the first freely available (Naive) Bayesian mail/spam filter
- NClassifier - NClassifier is a.NET library that supports text classification and text summarization. It is a port of the Nick Lothian's popular Java text classification engine, Classifier4J.
- Classifier4J - Classifier4J is a Java library designed to do text classification. It comes with an implementation of a Bayesian classifier, and now has some other features, including a text summary facility.
- MALLET - A Java package for document classification and other natural language processing tasks.
- nBayes - nBayes is an open source.NET library written in C#
- Apache Mahout - Machine learning package offered by Apache Open Source
- Weka - Popular open source machine learning package, written in Java
- C# implementation of Naive Bayes used for documents categorization that includes files processing, stop words filtering and stemming. Same site offers comparison to other algorithms.
- OpenPR-NB - A C++ implementation of Naive Bayes Classifier. It supports both multinomial and multivariate Bernoulli event model. The maximum likelihood estimate with a Laplace smoothing is used for learning parameters.