خوشه‌بندی

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
در خوشه‌بندی، هدف تقسیم داده به گروه‌های مختلف است که با رنگ‌های مختلف در اینجا نشان داده شده‌اند.

در آمار و یادگیری ماشینی، خوشه‌بندی یا آنالیز خوشه به فرایند گروه‌بندی اشیاء مشابه یکدیگر با هم است. مسئلهٔ خوشه‌بندی به دو شکل می‌تواند مطرح شود: (۱) یک ماتریس n\times n بی‌شباهتی داده می‌شود یا (۲) یک ماتریس n\times d که هر سطر آن یک شیء را توصیف می‌کند. خروجی الگوریتم می‌تواند به دو صورت باشد: (۱) گروه‌بندی اشیا به مجموعه‌های مجزا یا (۲) خوشه‌بندی سلسله مراتبی که یک درخت برای تقسیم‌بندی اشیا پیدا می‌کند. الگوریتم‌های نوع اول سریعتر هستند با زمان \mathcal{O}(nd) در مقابل زمان \mathcal{O}(n^2\log(n)) برای خوشه‌بندی سلسله‌مراتبی. از الگوریتم‌های مشهور برای خوشه‌بندی می‌توان به k-means اشاره کرد.[۱]

نگارخانه[ویرایش]

منابع[ویرایش]

  1. Murphy, Kevin. Machine learning a probabilistic perspective. MIT Press, 2012. 875. ISBN ‎0262018020.