نویسه‌خوان نوری

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

نویسه‌خوانی نوری[۱] که با سرواژه‌ی OCR شناخته می‌شود، عبارت است از بازشناسی خودکار متون موجود در تصاویر اسناد و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه. تصویر سند غالبا توسط روبشگر و یا دوربین دیجیتال تولید می‌شود و شامل تعدادی پیکسل با رنگهای مختلف و سطوح روشنایی گوناگون است. از دید انسان، یک سند ممکن است ارزش اطلاعاتی زیادی داشته باشد، لیکن از دید رایانه تصویر یک سند با تصویر یک منظره تفاوتی ندارد، چرا که هر دوی آنها مجموعه‌ای از پیکسل‌ها هستند. برای اینکه بتوان از اطلاعات نوشتاری تصویر سند استفاده کرد، باید به نحوی نوشته‌های موجود در سند را بازشناسی کرد. چنین کاری توسط نرم‌افزارهای نویسه‌خوان نوری انجام می‌شود.

واژهٔ OCR ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی بکار گرفته می‌شد. پسوند نوری در این عبارت در مقابل عبارت مرکب مغناطیسی قرار داده شد تا این روش را از روش قدیمی‌تر بازشناسی نویسه‌ها با مرکب مغناطیسی ،MICR، متمایز کند. با گذشت زمان و پیشرفت قابل توجه در این زمینه، روش‌های بازشناسی دستنوشته و متون چاپی مطرح شدند که دامنهٔ کار را به کلمات و عبارات رساندند. با وجود عدم تطبیق دقیق OCR با این موارد، این نام برای این روش‌ها و تا حدی برای بازشناسی دست‌نوشته‌های برخط هم استفاده شد و رواج پیدا کرد. هم‌اکنون OCR را بیشتر برای بازشناسی مستندات چاپی مثل صفحات کتاب‌ها، مجله‌ها و نامه‌های چاپی به کار می‌برند.

سامانهٔ نویسه‌خوان مثل یک نفر ماشین‌نویس، متن سند را می‌خواند و آن را به قالب مناسب برای ذخیره در رایانه تبدیل می‌کند. معمولاً یک روبشگر، تصویر سند را برای OCR فراهم می‌کند. سامانهٔ نویسه‌خوان، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشته‌ی متناظر با آن‌ها را در قالب مناسب ذخیره می‌کند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانهٔ نویسه‌خوان بسیار کم حجم و قابل جستجو است.

سامانه‌های نویسه‌خوان مثل بسیاری از سامانه‌های هوشمند دیگر، پیچیدگی زیادی دارد. پردازش تصویر و بازشناسی الگو دو پایهٔ اصلی این سامانه‌ها هستند. پیچیدگی این سامانه‌ها برای زبانهای گوناگون، متفاوت است. به عنوان مثال نوشتن OCR برای زبانهای لاتین به دلیل اینکه حروف آنها به طور مجزا نوشته می‌شود آسانتر است از زبانهایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر می‌چسبند. این موضوع به علاوهٔ جمعیت کم کاربران زبان فارسی، سبب شده سامانه‌های نویسه‌خوان قدرتمندی برای زبان فارسی نداشته باشیم. البته در سالهای اخیر تلاشهای قابل تقدیری از سوی برخی شرکتهای فعال در زمینهٔ پردازش تصویر انجام شده که برخی از آنها منجر به محصولات قابل قبولی شده است.

تاریخچه[ویرایش]

نوشتار اصلی: تاریخچه نویسه خوان نوری

نویسه خوان نوری اولیه می توانست پیرامون ۲ موضوع مورد استفاده قرار بگیرد: گسترش تلگراف و ایجاد ابزارهای خوانش برای نابینایان. در سال ۱۹۱۴ امانوئل گولدبرگ دستگاهی را ایجاد کرد که می توانست عناصر نوشتاری را بخواند و آنها را به کد های استاندارد تلگراف تبدیل کند. در همان زمان، ادموند فورنیر دالبی،: اُپتوفون را ایجاد کرد. یک اسکنر دستی که وقتی بر روی یک صفحه چاپی حرکت داده می شد، سایه روشن هایی را ایجاد می کرد که شبیه به حروف و عناصر نوشتاری بودند.

یادداشت‌ها[ویرایش]

  • ^ (Optical Character Recognition/Reader)
  • ^ (Magnetic Ink Character Recognition)
  • ^ (Online)

جستارهای وابسته[ویرایش]

منابع[ویرایش]

  1. نویسه‌خوانی نوری از واژه‌های مصوب فرهنگستان زبان و ادب فارسی به جای optical character recognition یا OCR در انگلیسی و در حوزهٔ رایانه است. «فرهنگ واژه‌های مصوّب فرهنگستان: ۱۳۷۶ تا ۱۳۸۵، بخش لاتین». فرهنگستان زبان و ادب فارسی. ۱۴۴. بازبینی‌شده در ۷ فروردین ۱۳۹۱. 

پیوند به بیرون[ویرایش]

جستجو در ویکی‌انبار در ویکی‌انبار پرونده‌هایی دربارهٔ نویسه‌خوان نوری موجود است.