فاکتورگیری نامنفی ماتریس

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

فاکتور گیری غیر منفی ماتریس یا Non-negative matrix factorization، مجموعه‌ای از الگوریتم‌ها برای تجزیه ماتریس \mathbf{V} به (معمولاً) دو ماتریس \mathbf{W} و \mathbf{H}. یعنی \operatorname{nmf}(\mathbf{V}) \rightarrow \mathbf{WH} . فاکتورگیری ماتریس‌ها معمولاً یکتا نیست و روش‌های مختلفی برای انجام آن ارائه شده است مانند تحلیل مؤلفه‌های اصلی (Independent Component Analysis) یا تجزیه مقدارهای منفرد (Singular Value Decomposition) و غیره. تفاوت این روش با روش‌های دیگر در این است که در فاکتورگیری غیر-منفی ماتریس این محدودیت را در نظر می‌گیریم که ماتریس‌های H و W باید ماتریس غیرمنفی باشند (تمامی المان‌های آنها مثبت باشد).

فاکتورگیری غیرمنفی ماتریس[ویرایش]

معمولاً زمانی که دوماتریس را به هم ضرب می‌کنیم، رتبهٔ ماتریس‌های فاکتور معمولاً بسیار کمتر از ماتریس حاصلضرب هستند. این یک انگیزهٔ بزرگ برای NMF است. یک مثال در زمینهٔ متن-کاوی:

بردار \mathbf{V} را با ۵۰۰ ستون و ۱۰۰۰ سطر در نظر می‌گیریم طوریکه هر ستون از این ماتریس یعنی \mathbf{v} یک متن را مشخص کند. یعنی ۵۰۰ متن هرکدام با ۱۰۰۰ کلمه. تصور کنید که ما از الگوریتم می‌خواهیم که ۱۰ ویژگی انتخاب کرده و بردار ویژگی \mathbf{W} را با ۱۰۰۰ سطر و ۱۰ ستون ایجاد کند. می‌توان مشاهده کرد که هر ستون در \mathbf{WH} ترکیب خطی ۱۰ بردار ویژه در \mathbf{W} با ضرایب موجود در \mathbf{H} هستند. در واقع می‌توان اینگونه فرض کرد که هر متن، ساخته شده از ترکیب خطی مجموعه از بردارهای ویژه است.

نرم‌افزارها[ویرایش]