روش کرنل

از ویکی‌پدیا، دانشنامهٔ آزاد

روش‌های کرنل یک کلاس قدرتمند از الگوریتم‌ها هستند که در یادگیری ماشین برای تحلیل الگو استفاده می‌شوند. آن‌ها به طور ویژه در حل مسائل غیرخطی با استفاده از طبقه‌بندی کننده‌های خطی موثر هستند. معروف ترین و پرکاربردترین الگوریتم در این کلاس، ماشین بردار پشتیبان است.

هدف اصلی تجزیه و تحلیل الگو، کشف و درک انواع مختلف روابط در مجموعه داده‌ها است. این روابط می‌توانند اشکال مختلفی داشته باشند، مانند خوشه‌ها، همبستگی‌ها و طبقه‌بندی‌ها. با استفاده از روش‌های کرنل، می‌توانیم این روابط را حتی در مجموعه داده‌های پیچیده و غیرخطی به طور موثر شناسایی و مطالعه کنیم.

همان‌طور که گفته شد، یکی از مزایای کلیدی روش‌های کرنل، به‌ویژه در ماشین بردار پشتیبان، توانایی آن‌ها در رسیدگی به مسائل غیرخطی با استفاده از طبقه‌بندی‌کننده‌های خطی است. طبقه‌بندی‌کننده‌های خطی سنتی تنها می‌توانند نقاط داده را با استفاده از مرزهای تصمیم خطی جدا کنند، که ممکن است برای مجموعه‌های داده با روابط غیرخطی کافی نباشد. روش‌های کرنل با نگاشت ضمنی داده‌ها در یک فضای ویژگی با ابعاد بالاتر، جایی که جداسازی خطی ممکن می‌شود، بر این محدودیت غلبه می‌کنند. این با استفاده از یک تابع کرنل که شباهت بین جفت نقاط داده را اندازه گیری می‌کند به دست می‌آید.

در الگوریتم‌های یادگیری ماشین سنتی، داده‌های خام باید قبل از استفاده برای تجزیه و تحلیل به شکل بردارهای ویژگی نمایش داده شوند. این فرآیند می‌تواند پیچیده و زمان‌بر باشد. با این حال، روش‌های کرنل رویکرد متفاوتی را ارائه می‌دهند و به جای تبدیل صریح داده‌ها، به یک تابع کرنل مشخص شده نیاز دارند.

تابع کرنل میزان شباهت بین جفت نقاط داده را با استفاده از ضرب داخلی محاسبه می‌کند. این مقدار، رابطه بین نقاط داده در یک فضای ویژگی با ابعاد بالاتر را نشان می‌دهد. مزیت کلیدی روش‌های کرنل این است که به ما اجازه می‌دهند بدون محاسبه صریح مختصات نقاط داده در فضای ویژگی بالاتر، میزان شباهت دو نقطه را اندازه‌گیری کنیم.

با وجود این مزایا، روش‌های کرنل می‌توانند برای مجموعه داده‌های بزرگ، از نظر محاسباتی کند باشند. با این حال، تکنیک‌های پردازش موازی می‌توانند با توزیع محاسبات در چندین پردازنده یا ماشین به کاهش این مشکل کمک کنند.

الگوریتم‌هایی که می‌توانند از تکنیک کرنل استفاده کنند معمولا در روابط آن‌ها داشتن ضرب داخلی بین داده‌های ورودی برای محاسبات کافی است. به عنوان نمونه الگوریتم پرسپترون (perceptron) ٬ ماشین بردار پشتیبان (svm) و تحلیل مولفه‌های اصلی (PCA) می‌توانند از تکنیک کرنل برای انجام الگوریتم در بعد فضای کرنل استفاده کنند. [۱] [۲] [۳] [۴]

مقدمه‌ای بر ریاضی در تکنیک کرنل[ویرایش]


برای ماشین بردار پشتیبانی که آن به شکل زیر تعریف شود: تابع کرنلی به شکل زیر دارد: که در آن نقاط به یک فضای 3 بعدی نگاشت می‌شوند که در آن می‌توان یک ابر صفحه جداکننده را به راحتی پیدا کرد.


ترفند کرنل یک مفهوم اساسی در روش‌های کرنل است و از محاسبات بردن داده به بعد بالاتر جلوگیری می‌کند. این تکنیک، الگوریتم‌های یادگیری خطی را قادر می‌سازد تا توابع غیرخطی یا مرزهای تصمیم را مدیریت کنند. در این تکنیک، به ازای هر و در فضای ورودی

توابع خاصی مثل

را می‌توان به عنوان یک ضرب داخلی در فضای بیان کرد.به تابع یک تابع کرنل می‌گویند.

به طور ساده‌تر اگر تابع یک تابع در نظر بگیرید که هر را به یک فضای دیگر می‌برد. تابع کرنل را می‌توان به صورت زیر بیان کرد:

 

هر تابعی به عنوان یک تابع کرنل قابل‌ قبول نیست و قانون مرسر تابع‌های موردقبول را تعیین می‌کند. این قانون بیان می‌کند یک تابع در صورتی یک کرنل معتبر است که ماتریس گِرم دیتا‌های ما یک ماتریس نیمه مثبت معین باشد. به این معنا که به ازای داده‌های ماتریس گرم را به صورت تعریف می‌کنیم. در صورتی که این ماتریس نیمه‌ مثبت معین باشد کرنل تعریف شده معتبر است.


توضیح غیررسمی بر روش کرنل[ویرایش]


در یک روش کرنل معمولی، داده‌های آموزشی شامل جفت ورودی و برچسب‌های مربوطه هستند که به صورت

نشان داده می‌شوند. در اینجا نمایانگر ویژگی‌های ورودی است (مثلاً مقادیر پیکسل در یک تصویر)، و نشان‌دهنده برچسب مربوطه (مثلاً برچسب کلاس تصویر) است. روش‌های هسته به جای یادگیری مجموعه‌ای از پارامترهای ثابت برای ویژگی‌ها، وزن را برای هر مثال آموزشی یاد می‌گیرند.

همانطور که می‌دانید برای پیش‌بینی ورودی‌های بدون برچسب، روش‌های کرنل از یک تابع شباهت استفاده می‌کنند که به عنوان کرنل نیز شناخته می‌شود که با نشان داده می‌شود. این تابع شباهت بین ورودی بدون برچسب و هر یک از ورودی‌های آموزشی را اندازه‌گیری می‌کند. تابع شباهت یک امتیاز شباهت بین دو ورودی را محاسبه می‌کند و یک نتیجه با ارزش واقعی را برمی‌گرداند.

طبقه‌بندی‌کننده دوتایی با استفاده از روش کرنل، برچسب را برای ورودی جدیدی که برچسب ندارد را با توجه به مثبت یا منفی بودن علامت حاصل از جمع وزن‌دار شباهت‌ها پیش‌بینی می‌کند. وزن‌های ، توسط الگوریتم یادگیری بر اساس مثال‌های آموزشی تعیین می‌شوند. برچسب پیش بینی شده به صورت زیر محاسبه می‌شود:


در این معادله، نشان‌دهنده برچسب پیش‌بینی‌شده برای ورودی بدون برچسب . تابع کرنل، ، مسئول اندازه‌گیری شباهت بین هر جفت ورودی است. محدوده‌ی مجموع‌ها روی مثال‌ برچسب‌گذاری شده در مجموعه داده آموزشی، با است. نشان دهنده برچسب‌های کلاس است. وزن‌ها، ، وزن‌های مرتبط با هر مثال آموزشی هستند که توسط الگوریتم یادگیری تعیین می‌شوند. تابع علامت، ، مثبت یا منفی بودن طبقه‌بندی پیش‌بینی‌شده را تعیین می‌کند. [۵]

کاربردها[ویرایش]


روش‌های کرنل در طیف گسترده‌ای از حوزه‌های کاربردی به کار گرفته شده‌اند که تطبیق پذیری و اثربخشی خود را در حل مشکلات مختلف نشان می‌دهد. یکی از این حوزه‌ها، زمین‌آمار است که شامل تجزیه و تحلیل و مدل سازی داده‌های مکانی است. روش‌های کرنل در تکنیک‌های زمین‌آماری مانند کریجینگ، که با هدف تخمین مقادیر در مکان‌های مشاهده‌نشده بر اساس نقاط داده مشاهده‌شده، مورد استفاده قرار گرفته‌اند. با استفاده از توابع کرنل برای اندازه‌گیری شباهت فضایی بین نقاط داده، روش‌های کریجینگ می‌توانند پیش‌بینی‌های دقیقی انجام دهند و سطوح درون‌یابی را ایجاد کنند. به طور مشابه، وزن‌دهی معکوس فاصله، یکی دیگر از تکنیک‌های زمین آماری، از روش‌های کرنل برای تخمین مقادیر بر اساس فاصله معکوس بین نقاط داده استفاده می‌کند. این برنامه‌ها قدرت روش‌های هسته را در تجزیه و تحلیل داده‌های مکانی و انجام پیش بینی‌های آگاهانه نشان می‌دهند.

در زمینه بیوانفورماتیک، روش‌های کرنل سهم قابل توجهی داشته اند. بیوانفورماتیک شامل تجزیه و تحلیل داده‌های بیولوژیکی مانند توالی‌های DNA، ساختارهای پروتئینی و پروفایل‌های بیان ژن است. روش‌های کرنل با موفقیت در کارهایی مانند طبقه‌بندی توالی DNA، که در آن شباهت بین توالی‌ها با استفاده از توابع هسته محاسبه می‌شود، استفاده شده‌اند. با ثبت الگوها و روابط زیربنایی در توالی‌های DNA، طبقه‌بندی‌کننده‌های مبتنی بر هسته می‌توانند به طور دقیق توالی‌ها را در دسته‌های مختلف طبقه‌بندی کنند و به تجزیه و تحلیل ژنوم و تشخیص بیماری کمک کنند. علاوه بر این، شیمی‌انفورماتیک، که بر تجزیه و تحلیل داده‌های شیمیایی تمرکز دارد، از روش‌های کرنل بهره برده است. رویکردهای مبتنی بر هسته در کارهایی مانند پیش‌بینی ویژگی‌های مولکولی، غربالگری مجازی و طراحی دارو مورد استفاده قرار گرفته‌اند که تجزیه و تحلیل کارآمد و دقیق ترکیبات شیمیایی را ممکن می‌سازد.

یکی دیگر از حوزه‌های کاربردی قابل توجه روش‌های هسته، استخراج اطلاعات است که شامل استخراج خودکار اطلاعات ساختاریافته از داده‌های متنی بدون ساختار است. روش‌های کرنل در کارهای مختلف استخراج اطلاعات، مانند شناسایی موجودیت نام‌گذاری شده، استخراج رابطه و تجزیه و تحلیل احساسات به کار گرفته شده‌اند. با استفاده از توابع کرنل، این روش‌ها می‌توانند شباهت بین نمونه‌های متن را اندازه‌گیری کنند و شناسایی دقیق موجودیت‌های نام‌گذاری‌شده (به عنوان مثال، نام افراد، مکان‌ها) و استخراج روابط بین موجودیت‌ها را امکان‌پذیر می‌سازند. علاوه بر این، در تشخیص دست‌نویس، روش‌های کرنل در تشخیص و تفسیر کاراکترها و متون دست‌نویس مؤثر بوده‌اند. با استفاده از توابع هسته برای اندازه‌گیری شباهت بین کاراکترهای مرجع و نمونه‌های دست‌نویس، طبقه‌بندی‌کننده‌های مبتنی بر کرنل می‌توانند به طور دقیق دست‌نویس را شناسایی و رمزگشایی کنند و کاربردها را در زمینه‌هایی مانند تجزیه و تحلیل اسناد و پردازش خودکار فرم تسهیل کنند.


چند نمونه کرنل[ویرایش]



  • کرنل خطی

کرنل خطی یک تابع کرنل ساده و پرکاربرد است. که در این روش، ضرب داخلی بین بردارهای ویژگی ورودی محاسبه می‌کند و در نتیجه روابط خطی بین نقاط داده را ثبت می‌کند.

فرمول کرنل خطی به صورت زیر است:

 

در اینجا، بردارهای ویژگی ورودی را نشان می‌دهند. هسته خطی اساساً شباهت بین دو بردار را با حاصل ضرب نقطه‌ای آنها اندازه گیری می‌کند. به ویژه زمانی مفید است که داده‌ها را بتوان به خوبی با یک مرز تصمیم گیری خطی از هم جدا کرد.


  • کرنل چندجمله‌ای

کرنل چند جمله‌ای، یک کرنل غیرخطی است که می‌تواند روابط پیچیده‌تری را بین نقاط داده ثبت کند. در اینجا، یکتابع چند جمله ای را بر حاصل ضرب نقطه ای بردارهای ویژگی اعمال می‌کند، که اجازه می‌دهد تا مرزهای تصمیم غیرخطی را تعیین کند.

فرمول کرنل چند جمله‌ای:

 


در این فرمول ابرپارامترهای کرنل چند جمله ای هستند. تأثیر حاصلضرب نقطه‌ای را کنترل می‌کند، یک جمله ثابت اختیاری است، و نشان‌دهنده درجه چند جمله‌ای است. با تنظیم این ابرپارامترها، کرنل چند جمله‌ای می‌تواند درجات مختلفی از غیرخطی بودن را در داده‌ها ثبت کند.


  • کرنل گاوسی

کرنل گاوسی که به عنوان کرنل تابع پایه شعاعی نیز شناخته می‌شود، یک کرنل پرکاربرد است که روابط پیچیده را بدون تعریف صریح درجه یا چند جمله‌ای ثبت می‌کند. شباهت بین نقاط داده را بر اساس فاصله اقلیدسی آن‌ها اندازه‌گیری می‌کند.

فرمول کرنل گاوسی به صورت زیر است:

 

در این فرمول، و بردارهای ویژگی هستند و یک ابرپارامتر است که عرض کرنل را کنترل می‌کند. هسته گاوسی شباهت بیشتری (یعنی مقدار کرنل بزرگتر) به نقاط داده‌ای که به یکدیگر نزدیکتر هستند و شباهت کمتری را به نقاطی که از هم دورتر هستند اختصاص می‌دهد. این می‌تواند روابط پیچیده و غیرخطی بین نقاط داده را ثبت کند و معمولاً در برنامه‌هایی مانند تشخیص تصویر و خوشه‌بندی استفاده می‌شود.

منابع[ویرایش]

  1. Theodoridis, Sergios (2008). Pattern Recognition. Elsevier B.V. p. 203. ISBN 9780080949123.
  2. "Kernel method". Engati (به انگلیسی). Retrieved 2023-04-20.
  3. "Kernel method". Wikipedia (به انگلیسی). 2023-04-04.
  4. "Kernel Method". sciencedirect (به انگلیسی).
  5. "A Review of Kernel Methods in Machine Learning". researchgate (به انگلیسی).