پیش‌نویس:تشخیص سه‌بعدی

    از ویکی‌پدیا، دانشنامهٔ آزاد

    روش تشخیص سه‌بعدی[ویرایش]

    مدل سه‌بعدی چهره انسان


    در تکنیک تشخیص چهره سه بعدی از حسگرهای سه بعدی برای گرفتن اطلاعات در مورد شکل صورت استفاده می‌شود.

    سپس از این اطلاعات برای شناسایی ویژگی‌های متمایز سطح صورت مانند کانتور حفره‌های چشم، بینی و چانه استفاده می‌شود. یکی از مزایای تشخیص چهره سه بعدی این است که مانند سایر تکنیک‌ها تحت تأثیر تغییرات نور، استفاده از آرایش، و زاویه‌ی عکس گرفته شده، قرار نمی‌گیرد. البته تاثیر حالت‌های چهره همچنان یک چالش هست. اما می‌تواند چهره را از طیف وسیعی از زاویه دید، از جمله نمای نمایه شناسایی کند. نشان داده شده است که تشخیص سه‌بعدی به شدت دقت تشخیص را نسبت به روش‌های دوبعدی معادل خود بالا می برد. همچنین می‌توان از مدل سه‌بعدی استفاده کرد تا تشخیص چهره‌ی دوبعدی را با تغییر زاویه‌ی فعلی به زاویه‌ای که مدل آن را بهتر تشخیص می‌دهد، با دقت بالاتری صورت گیرد.


    تحقیقات تشخیص چهره سه بعدی با تولید حسگرهای پیچیده‌ای که نور ساختاری را بر روی صورت انجام می‌دهند، امکان‌پذیر است. تکنیک تطبیق سه بعدی به عبارات حساس است، بنابراین محققان در Technion از ابزارهای هندسه متریک برای درمان عبارات به عنوان ایزومتری استفاده کردند. یک روش جدید برای گرفتن تصاویر سه بعدی از چهره‌ها از سه دوربین ردیابی استفاده می‌کند که از زوایای مختلف نشان داده می‌شوند. یک دوربین در جلو سوژه قرار دارد، دوربین دوم به طرف و دوربین سوم به صورت زاویه دار. همه این دوربین‌ها با هم کار می‌کنند بنابراین می‌تواند صورت سوژه را در زمان واقعی ردیابی کند و قادر به تشخیص و تشخیص چهره باشد. اما همین مسئله همچنان یکی از بزرگترین چالش های تشخیص سه‌بعدی باقی مانده است. روش دیگری که اخیرا برای حل این مشکل ارائه شده است، استفاده از دیدگاه عمیق است که با برانداختن یک مش بر روی چهره و ضبط یک ویدیو از آن، یک مدل سه بعدی با کیفیت بالا ارائه می‌دهد.


    به صورت کلی، یک سیستم تشخیص چهره سه بعدی، چهار بخش دارد. ابتدا به دست آوردن دیتا، پیش پردازش، استخراج ویژگی و نهایتا دسته بندی ویژگی ها برای پروسه مد نظر می باشد. همانطور که قبلتر ذکر شد، این داده ی سه بعدی را می توان به روش های مختلفی همچون استفاده از اسکن کننده ی لیزری، استفاده از چند دوربین، استفاده از یک دوربین با یک پروژکتور نوری به دست آورد. که نتیجه یک مدل یا "عکس بازه‌ای" می شود با پیکسل هایی که فاصله هر نقطه صورت را از دوربین ضبط کرده اند. بدیهتا کیفیت این داده وابسته به ابزار تولید و ضبط می باشد. بعد از به دست آوردن داده ی اولیه، پیش پردازش شروع می شود و روش هایی همچون "حذف اختلالات"، "پر کردن نقاط خالی"، "صاف کردن" و ... انجام می گیرد تا داده ها منظم تر شوند. سپس تعدادی از ویژگی های صفحه که اطلاعات کافی را برای تشخیص به ما می دهند انتخاب شده و می توانند محلی یا جهانی باشند. این ویژگی ها عموما به فرم فاصله بین نقاط سطح، خمیدگی سطح، و ویژگی های هندسی دیگر می باشند. در انتخاب این ویژگی ها مهم است که به ژست وابسته نباشند. در مرحله ی نهایی که دسته بندی ویژگی ها می باشد معمولا از الگوریتم های برداری همچون SVM, NN, PCA, LDA یا روش های آماری استفاده می شود. هنگامی که مدل آموزش داده شود، با داشتن پارامترهای فعلی اش و چهره هایی که می شناسد، می تواند تشخیص بدهد که چهره های جدیدی که می بیند را از قبل دیده یا نه.

    منابع افزوده شده[ویرایش]

    • "Object Detection". paperswithcode. Retrieved 2022-12-23.