یونی‌کد

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو
کتاب «استاندارد یونیکد، نسخهٔ ۵٫۰» کنسرسیوم یونی‌کد

یونی‌کُد[۱] (به انگلیسی: Unicode) استانداردی صنعتی برای رمزنگاری نویسه‌های رایانه‌ای و نمایش و پردازش متن به اکثر زبان‌های دنیا[۲] است.

این استاندارد هماهنگ با مجموعه جهانی نویسه‌ها تالیف شده‌است و به صورت کتابی به نام 'The Unicode Standard' منتشر شده‌است. آخرین ویرایش این استاندارد شامل بیش از ۱۱۰۰۰۰ نویسه و ۱۰۰ نماد، مجموعه‌ای از نمودارهای کد برای مرجع تصویری، روش رمزگذاری و مجموعه‌ای از استاندارد رمزگذاری کاراکتر، شمارش خواص شخصیت مانند حروف بزرگ و کوچک، مجموعه‌ای ازمرجع فایل‌های داده‌های کامپیوتر و تعدادی موارد مربوط مانند جزییات نویسه،برابری یونیکد، رندر کردن، نظم و صفحه نمایش دو جهته (برای نمایش صحیح متن حاوی اسکریپت راست به چپ مانند عربی، فارسی و عبری، و اسکریپت‌های سمت چپ به راست) مي باشد. در سال ۲۰۱۲، آخرین ویرایش، یونیکد ۶٫۱ است.

موفقیت یونیکد در یکی کردن کدبندی نویسه‌ها سبب استفاده گسترده اش در جهانی‌سازی و بومی‌سازی نرم افزارها شده‌است. این استاندارد در بسیاری از فناوری‌های اخیر پیاده شده‌است از جمله: اکس ام ال، زبان برنامه نویسی جاوا، چارچوب دات نت مایکروسافت و سیستم عامل‌های مدرن.

یونیکد می‌تواند توسط رمزنگاری نویسه‌های مختلفی پیاده سازی شود. پرکاربرد ترین رمز نگاری‌ها عبارت اند از: UTF-8، و UCS-2 که دیگر اعتبار ندارد، و UTF-16.

رمزنگاری UTF-8 برای رمزنگاری نویسه‌های موجود در استاندارد اسکی تنها ۱ بایت استفاده می‌کند.کد نویسه‌های موجود در رمز نگاری اسکی، در هر دو رمزنگاری یکی است. این رمز نگاری حداکثر ۴ بایت برای هر نویسه استفاده می‌کند.UCS-2 برای تمام نویسه‌ها از ۲ بایت استفاده می‌کند بنابراین نمی‌تواند تمام نویسه‌های موجود در استاندارد فعلی یونیکد را رمزنگاری کند. UTF-16 رمزنگاری UCS-2 را گسترش می‌دهد و برای نویسه‌های باقیمانده از ۴ بایت استفاده می‌کند.

تاریخچه و توسعه[ویرایش]

هدف یونیکد رفع محدودیت‌های موجود در کدبندی نویسه‌های قدیمی است، مانند کدبندی‌هایی که بر پایه استاندارد ISO 8859 تعریف شده‌اند، که استفاده گسترده‌ای در کشورهای مختلف پیدا کرده‌اند، ولی با یکدیگر سازگار نیستند. بسیاری از کدبندی‌های قدیمی این مشکل مشترک را دارند که امکان پردازش متن‌های دوزبانه(معمولا به وسیله نویسه‌های لاتین و نمادهای محلی) را فراهم می‌کنند، ولی پردازش بیش از دو زبان را ممکن نمی‌کنند.

نقش یونیکد در پردازش متن این است که به جای یک تصویر برای هر نویسه یک کد منحصر به فرد ارایه می‌کند. به عبارت دیگر، یونیکد یک نویسه را به صورت مجازی ارایه می‌کند و کار ساخت تصویر(شامل اندازه، شکل، قلم، یا سبک) نویسه را به عهده نرم افزار دیگری مانند مرورگر وب یا واژه‌پرداز می‌گذارد.

یونیکد در ویندوز[ویرایش]

در ویندوز ای‌پی‌آی توابع یونیکد با پسوند W می‌آیند. (مثال: CreateWindowExW) پسوند W حرف اول عبارت wide character است که در زبان‌های برنامه نویسی انواع داده‌ای که یونیکد را پشتیبانی می‌کنند اسامی مشابهی مانند WCHAR دارند و گاهی به آن نویسهٔ چندبایتی (به انگلیسی: multibyte character) نیز گفته می‌شود.

همکاران ایرانی[ویرایش]

روزبه پورنادر[۳] (دانشگاه شریفبهداد اسفهبد[۴][۵] (دانشگاه شریفهومن پورناصح[۶] (مایکروسافت) و کمیل بهمن‌پور[۷][۸] (چرتکه) از جمله ایرانیانی هستند که در توسعهٔ استاندارد یونیکد بخصوص در زبان‌های راست به چپ فارسی، عربی و عبری به کنسرسیوم یونیکد، تولیدکنندگان سیستم‌عامل، و شرکت‌های فعال در این زمینه کمک شایانی کرده‌اند.

همچنین بخوانید[ویرایش]

ویکی‌پدیا:خط فارسی را پاس بداریم

وارد کردن یونیکد

کدبندی نویسه

نویسه

پیوند به بیرون[ویرایش]

«یونیکد در وبلاگ گوگل». 

پانویس[ویرایش]

  1. "Unicode Transcriptions". The Unicode Consortium. 2011-11-11. Retrieved 2012-02-22.
  2. Unicode Standard
  3. «دربارهٔ سخنرانان کنفرانس یونی‌کد»(انگلیسی)‎. کنفرانس یونی‌کد. بازبینی‌شده در ۲۰ ژوئیهٔ ۲۰۰۹. 
  4. «بهداد اسفهبد، پروژهٔ فارسی وب»(انگلیسی)‎. کنسرسیوم یونی‌کد. بازبینی‌شده در ۱۰ ژوئیهٔ ۲۰۰۹. 
  5. «صفحهٔ شخصی بهداد اسفهبد»(انگلیسی)‎. بهداد اسفهبد. بازبینی‌شده در ۱۰ ژوئیهٔ ۲۰۰۹. 
  6. «نوزدهمین همایش بین المللی یونی‌کد»(انگلیسی)‎. کنسرسیوم یونی‌کد. بازبینی‌شده در ۱۰ ژوئیهٔ ۲۰۰۹. 
  7. «چرتکه راضی از برنامهٔ تحقیق و توسعهٔ آفیس اینفوپت»(انگلیسی)‎. ئی‌فرمز نیوز، ۵ نوامبر ۲۰۰۳. بازبینی‌شده در ۲۵ ژوئیهٔ ۲۰۰۹. 
  8. «وب‌گاه رسمی کمیل بهمن‌پور»(فارسی)‎. کمیل بهمن‌پور. بازبینی‌شده در ۱۰ ژوئیهٔ ۲۰۰۹. 

منابع[ویرایش]

جستجو در ویکی‌انبار در ویکی‌انبار پرونده‌هایی دربارهٔ یونی‌کد موجود است.