یونیکد
یونیکُد[۱] (به انگلیسی: Unicode) استانداردی برای کُد کردن نویسههای رایانهای و نمایش و پردازش متن به اکثر زبانهای دنیا[۲] است. هر زبان یک قالب یونیکد دارد.
این استاندارد هماهنگ با مجموعه جهانی نویسهها تألیف شدهاست و به صورت کتابی به نام 'The Unicode Standard' منتشر شدهاست. آخرین ویرایش این استاندارد شامل بیش از ۱۱۰۰۰۰ نویسه و ۱۰۰ نماد، مجموعهای از نمودارهای کد برای مرجع تصویری، روش رمزگذاری و مجموعهای از استاندارد رمزگذاری کاراکتر، شمارش خواص شخصیت مانند حروف بزرگ و کوچک، مجموعهای از مرجع فایلهای دادههای کامپیوتر و تعدادی موارد مربوط مانند جزئیات نویسه، برابری یونیکد، رندر کردن، نظم و صفحه نمایش دو جهته (برای نمایش صحیح متن حاوی اسکریپت راست به چپ مانند عربی، فارسی و عبری، و اسکریپتهای سمت چپ به راست) میباشد. تا تاریخ مارس ۲۰۱۹، آخرین ویرایش، یونیکد ۱۲٫۰ است.
موفقیت یونیکد در یکی کردن کد بندی نویسهها سبب استفاده گسترده اش در جهانیسازی و بومیسازی نرمافزارها شدهاست. این استاندارد در بسیاری از فناوریهای اخیر پیاده شدهاست از جمله: اکس ام ال، زبان برنامهنویسی جاوا، چارچوب دات نت مایکروسافت و سیستم عاملهای مدرن.
یونیکد میتواند توسط کدبندیهای مختلفی پیادهسازی شود. پرکاربردترین رمز نگاریها عبارت اند از: UTF-8، و UCS-2 که دیگر اعتبار ندارد، و UTF-16.
کدبندی UTF-8 برای کدبندیهای موجود در استاندارد اسکی تنها ۱ بایت استفاده میکند. کد نویسههای موجود در رمز نگاری اسکی، در هر دو کدبندی یکی است. این رمز نگاری حداکثر ۴ بایت برای هر نویسه استفاده میکند.UCS-2 برای تمام نویسهها از ۲ بایت استفاده میکند بنابراین نمیتواند تمام نویسههای موجود در استاندارد فعلی یونیکد را کدبندی کند. UTF-16 کدبندی UCS-2 را گسترش میدهد و برای نویسههای باقیمانده از ۴ بایت استفاده میکند.
تاریخچه و توسعه[ویرایش]
هدف یونیکد رفع محدودیتهای موجود در کدبندی نویسههای قدیمی است، مانند کدبندیهایی که بر پایه استاندارد ISO 8859 تعریف شدهاند، که استفاده گستردهای در کشورهای مختلف پیدا کردهاند، ولی با یکدیگر سازگار نیستند. بسیاری از کدبندیهای قدیمی این مشکل مشترک را دارند که امکان پردازش متنهای دوزبانه (معمولا به وسیله نویسههای لاتین و نمادهای محلی) را فراهم میکنند، ولی پردازش بیش از دو زبان را ممکن نمیکنند.
نقش یونیکد در پردازش متن این است که به جای یک تصویر برای هر نویسه یک کد منحصر به فرد ارائه میکند. به عبارت دیگر، یونیکد یک نویسه را به صورت مجازی ارائه میکند و کار ساخت تصویر (شامل اندازه، شکل، قلم، یا سبک) نویسه را به عهده نرمافزار دیگری مانند مرورگر وب یا واژهپرداز میگذارد.
یونیکد در ویندوز[ویرایش]
در ویندوز ایپیآی توابع یونیکد با پسوند W میآیند. (مثال: CreateWindowExW) پسوند W حرف اول عبارت wide character است که در زبانهای برنامهنویسی انواع دادهای که یونیکد را پشتیبانی میکنند اسامی مشابهی مانند WCHAR دارند و گاهی به آن نویسهٔ چندبایتی (به انگلیسی: multibyte character) نیز گفته میشود.
جستارهای وابسته[ویرایش]
پیوند به بیرون[ویرایش]
پانویس[ویرایش]
- ↑ "Unicode Transcriptions". The Unicode Consortium. 2011-11-11. Retrieved 2012-02-22.
- ↑ Unicode Standard
منابع[ویرایش]
| در ویکیانبار پروندههایی دربارهٔ یونیکد موجود است. |
- «یونیکد چیست؟». ترجمهٔ روزبه پورنادر. کنسرسیوم یونیکد. دریافتشده در ۱۰ ژوئیهٔ ۲۰۰۹.
- مشارکتکنندگان ویکیپدیا. «Unicode». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۱۱ ژوئن ۲۰۰۹.
| این یک مقالهٔ خرد پیرامون رایانه است. با گسترش آن به ویکیپدیا کمک کنید. |