بینایی رایانهای: تفاوت میان نسخهها
مسعود لپه چی (بحث | مشارکتها) جزبدون خلاصۀ ویرایش |
|||
خط ۱: | خط ۱: | ||
'''بینایی رایانهای''' یا '''بینایی کامپیوتری''' (Computer vision) یا '''بینایی ماشینی''' (Machine vision) یکی از شاخههای مدرن، و پرتنوع [[هوش مصنوعی|هوش مصنوعی]] است که با ترکیب |
'''بینایی رایانهای''' یا '''بینایی کامپیوتری''' (Computer vision) یا '''بینایی ماشینی''' (Machine vision) یکی از شاخههای مدرن، و پرتنوع [[هوش مصنوعی|هوش مصنوعی]] است که با ترکیب روشهای مربوط به [[پردازش تصاویر]]<ref>Image processing</ref> و ابزارهای [[یادگیری ماشینی]]<ref>Machine learning</ref> رایانهها را به بینایی اشیاء، مناظر، و «درک» هوشمند [[ویژگی (بینایی ماشینی)|خصوصیات]] گوناگون آنها توانا میگرداند. |
||
== کاوش در دادهها == |
== کاوش در دادهها == |
||
مقالهٔ اصلی: [[کاوشهای ماشینی در دادهها]] |
مقالهٔ اصلی: [[کاوشهای ماشینی در دادهها]] |
||
بینایی ماشینی را میشود یکی از مصادیق و نمونههای بارز زمینهٔ مادر و اصلیتر کاوشهای ماشینی دادهها بهحساب آورد که در آن دادهها تصاویر دوبعدی یا سهبعدی هستند، که آنها را با استفاده از هوش مصنوعی آنالیز |
بینایی ماشینی را میشود یکی از مصادیق و نمونههای بارز زمینهٔ مادر و اصلیتر کاوشهای ماشینی دادهها بهحساب آورد که در آن دادهها تصاویر دوبعدی یا سهبعدی هستند، که آنها را با استفاده از هوش مصنوعی آنالیز میکنند. |
||
== وظایف اصلی در بینایی رایانهای == |
== وظایف اصلی در بینایی رایانهای == |
||
=== تشخیص شیء === |
=== تشخیص شیء === |
||
تشخیص حضور و/یا [[تبدیل آفینی|حالت]] شیء در یک تصویر. به عنوان مثال: |
تشخیص حضور و/یا [[تبدیل آفینی|حالت]] شیء در یک تصویر. به عنوان مثال: |
||
* جستجو برای [[تصویر دیجیتال|تصاویر دیجیتال]] بر اساس محتوای |
* جستجو برای [[تصویر دیجیتال|تصاویر دیجیتال]] بر اساس محتوای آنها ([[بازیابی محتوامحور تصاویر]]). |
||
* شناسایی صورت انسانها و موقعیت |
* شناسایی صورت انسانها و موقعیت آنها در عکسها. |
||
* تخمین حالت سهبعدی انسانها و اندامهایشان. |
* تخمین حالت سهبعدی انسانها و اندامهایشان. |
||
خط ۲۲: | خط ۱۹: | ||
=== تفسیر منظره === |
=== تفسیر منظره === |
||
ساختن یک مدل از یک تصویر/تصویر متحرک. بهعنوان مثال: |
ساختن یک مدل از یک تصویر/تصویر متحرک. بهعنوان مثال: |
||
* ساختن یک مدل از ناحیهٔ پیرامونی به کمک تصاویری که از دوربین نصب شده بر روی یک [[ربات]] گرفته میشوند. |
* ساختن یک مدل از ناحیهٔ پیرامونی به کمک تصاویری که از دوربین نصب شده بر روی یک [[ربات]] گرفته میشوند. |
||
=== خودمکانیابی === |
=== خودمکانیابی === |
||
خط ۳۵: | خط ۳۲: | ||
=== پیشپردازش === |
=== پیشپردازش === |
||
⚫ | |||
⚫ | |||
* زیر[[نمونهگیری]] تصویر. |
* زیر[[نمونهگیری]] تصویر. |
||
* اعمال [[فیلتر دیجیتال|فیلترهای دیجیتال]]. |
* اعمال [[فیلتر دیجیتال|فیلترهای دیجیتال]]. |
||
خط ۵۲: | خط ۴۸: | ||
=== استخراج ویژگی === |
=== استخراج ویژگی === |
||
هدف از [[استخراج ویژگی]] کاهش دادن بیش تر دادهها به مجموعهای از [[ویژگی (بینایی ماشینی)|ویژگیهاست]]، که باید به اغتشاشاتی چون [[شرایط نورپردازی]]، [[موقعیت دوربین]]، [[نویز]] و [[اعوجاج]] ایمن باشند. نمونههایی از استخراج ویژگی عبارتاند از: |
هدف از [[استخراج ویژگی]] کاهش دادن بیش تر دادهها به مجموعهای از [[ویژگی (بینایی ماشینی)|ویژگیهاست]]، که باید به اغتشاشاتی چون [[شرایط نورپردازی]]، [[موقعیت دوربین]]، [[نویز]] و [[اعوجاج]] ایمن باشند. نمونههایی از استخراج ویژگی عبارتاند از: |
||
* انجام [[آشکارسازی لبه]]. |
* انجام [[آشکارسازی لبه]]. |
||
خط ۶۰: | خط ۵۵: | ||
=== ثبت === |
=== ثبت === |
||
هدف گام ثبت برقراری تناظر میان ویژگیهای مجموعه برداشت شده و ویژگیهای اجسام شناختهشده در یک [[پایگاه دادهها|پایگاه دادههای]] [[مدل]] و/یا ویژگیهای تصویر قبلی است. در گام ثبت باید به یک [[فرضیه]] نهایی رسید. چند روش این کار عبارتاند از: |
هدف گام ثبت برقراری تناظر میان ویژگیهای مجموعه برداشت شده و ویژگیهای اجسام شناختهشده در یک [[پایگاه دادهها|پایگاه دادههای]] [[مدل]] و/یا ویژگیهای تصویر قبلی است. در گام ثبت باید به یک [[فرضیه]] نهایی رسید. چند روش این کار عبارتاند از: |
||
* [[تخمین کمترین مربعات]]. |
* [[تخمین کمترین مربعات]]. |
||
خط ۶۸: | خط ۶۲: | ||
== پانوشتهها == |
== پانوشتهها == |
||
{{پانویس}} |
{{پانویس}} |
||
خط ۸۰: | خط ۷۳: | ||
* [[هوش مصنوعی]] |
* [[هوش مصنوعی]] |
||
* [[یادگیری ماشینی]] |
* [[یادگیری ماشینی]] |
||
* [[کاوشهای ماشینی در دادهها]] |
* [[کاوشهای ماشینی در دادهها]] |
||
* [[محاسبات نرم]] |
* [[محاسبات نرم]] |
||
* [[منطق فازی]] |
* [[منطق فازی]] |
||
خط ۹۰: | خط ۸۳: | ||
{{چپچین}} |
{{چپچین}} |
||
* Gonzalez, R. C., and Woods, R. E. ''Digital Image Processing'', 2nd edition, Prentice-Hall, Inc., 2002 |
* Gonzalez, R. C. , and Woods, R. E. ''Digital Image Processing'', 2nd edition, Prentice-Hall, Inc. , 2002 |
||
{{پایان چپچین}} |
{{پایان چپچین}} |
||
{{علوم رایانه}} |
{{علوم رایانه}} |
نسخهٔ ۱۷ ژانویهٔ ۲۰۱۵، ساعت ۱۵:۴۱
بینایی رایانهای یا بینایی کامپیوتری (Computer vision) یا بینایی ماشینی (Machine vision) یکی از شاخههای مدرن، و پرتنوع هوش مصنوعی است که با ترکیب روشهای مربوط به پردازش تصاویر[۱] و ابزارهای یادگیری ماشینی[۲] رایانهها را به بینایی اشیاء، مناظر، و «درک» هوشمند خصوصیات گوناگون آنها توانا میگرداند.
کاوش در دادهها
مقالهٔ اصلی: کاوشهای ماشینی در دادهها
بینایی ماشینی را میشود یکی از مصادیق و نمونههای بارز زمینهٔ مادر و اصلیتر کاوشهای ماشینی دادهها بهحساب آورد که در آن دادهها تصاویر دوبعدی یا سهبعدی هستند، که آنها را با استفاده از هوش مصنوعی آنالیز میکنند.
وظایف اصلی در بینایی رایانهای
تشخیص شیء
تشخیص حضور و/یا حالت شیء در یک تصویر. به عنوان مثال:
- جستجو برای تصاویر دیجیتال بر اساس محتوای آنها (بازیابی محتوامحور تصاویر).
- شناسایی صورت انسانها و موقعیت آنها در عکسها.
- تخمین حالت سهبعدی انسانها و اندامهایشان.
پیگیری
پیگیری اشیاء شناخته شده در میان تعدادی تصویر پشت سر هم. به عنوان مثال:
- پیگیری یک شخص هنگامی که در یک مرکز خرید راه میرود.
تفسیر منظره
ساختن یک مدل از یک تصویر/تصویر متحرک. بهعنوان مثال:
- ساختن یک مدل از ناحیهٔ پیرامونی به کمک تصاویری که از دوربین نصب شده بر روی یک ربات گرفته میشوند.
خودمکانیابی
مشحص کردن مکان و حرکت خود دوربین به عنوان عضو بینایی رایانه. بهعنوان مثال:
سامانههای بینایی رایانهای
یک سامانهٔ نوعی بینایی رایانهای را میتوان به زیرسامانههای زیر تقسیم کرد:
تصویربرداری
تصویر یا دنباله تصاویر با یک سامانه تصویربرداری(دوربین، رادار، لیدار، سامانه توموگرافی) برداشته میشود. معمولاً سامانه تصویربرداری باید پیش از استفاده تنظیم شود.
پیشپردازش
در گام پیشپردازش، تصویر در معرض اَعمال «سطح پایین» قرار میگیرد. هدف این گام کاهش نوفه (کاهش نویز - جدا کردن سیگنال از نویز) و کمکردن مقدار کلی دادهها است. این کار نوعاً با بهکارگیری روشهای گوناگون پردازش تصویر(دیجیتال) انجام میشود. مانند:
- زیرنمونهگیری تصویر.
- اعمال فیلترهای دیجیتال.
- پیچشها.
- همبستگیها یا فیلترهای خطی لغزشنابسته.
- عملگر سوبل.
- محاسبهٔ گرادیان x و y(و احتمالاً گرادیان زمانی).
- تقطیع تصویر.
- آستانهگیری پیکسلی.
- انجام یک ویژهتبدیل بر تصویر.
- انجام تخمین حرکت برای ناحیههای محلی تصویرکه به نام تخمین شارش نوری هم شناخته میشود.
- تخمین ناهمسانی در تصاویر برجستهبینی.
- تحلیل چنددقتی.
استخراج ویژگی
هدف از استخراج ویژگی کاهش دادن بیش تر دادهها به مجموعهای از ویژگیهاست، که باید به اغتشاشاتی چون شرایط نورپردازی، موقعیت دوربین، نویز و اعوجاج ایمن باشند. نمونههایی از استخراج ویژگی عبارتاند از:
- انجام آشکارسازی لبه.
- استخراج ویژگیهای گوشهای.
- استخراج تصاویر چرخش از نقشههای ژرفا.
- بدست آوردن خطوط تراز و احتمالاً گذر از صفرهای خمش.
ثبت
هدف گام ثبت برقراری تناظر میان ویژگیهای مجموعه برداشت شده و ویژگیهای اجسام شناختهشده در یک پایگاه دادههای مدل و/یا ویژگیهای تصویر قبلی است. در گام ثبت باید به یک فرضیه نهایی رسید. چند روش این کار عبارتاند از:
- تخمین کمترین مربعات.
- تبدیل هاگ در انواع گوناگون.
- درهمسازی هندسی.
- پالودن ذرهای.
پانوشتهها
پیوندهای برونی
جستارهای وابسته
- هوش مصنوعی
- یادگیری ماشینی
- کاوشهای ماشینی در دادهها
- محاسبات نرم
- منطق فازی
- پردازش تصاویر
- تشخیص پلاک خودرو
منابع
- Gonzalez, R. C. , and Woods, R. E. Digital Image Processing, 2nd edition, Prentice-Hall, Inc. , 2002