یونیکد
یونیکُد[۱] (به انگلیسی: Unicode) استانداردی صنعتی برای رمزنگاری نویسههای رایانهای و نمایش و پردازش متن به اکثر زبانهای دنیا[۲] است.
این استاندارد هماهنگ با مجموعه جهانی نویسهها تالیف شدهاست و به صورت کتابی به نام 'The Unicode Standard' منتشر شدهاست. آخرین ویرایش این استاندارد شامل بیش از ۱۱۰۰۰۰ نویسه و ۱۰۰ نماد، مجموعهای از نمودارهای کد برای مرجع تصویری، روش رمزگذاری و مجموعهای از استاندارد رمزگذاری کاراکتر، شمارش خواص شخصیت مانند حروف بزرگ و کوچک، مجموعهای ازمرجع فایلهای دادههای کامپیوتر و تعدادی موارد مربوط مانند جزییات نویسه،برابری یونیکد، رندر کردن، نظم و صفحه نمایش دو جهته (برای نمایش صحیح متن حاوی اسکریپت راست به چپ مانند عربی و عبری، و اسکریپتهای سمت چپ به راست) مي باشد. در سال ۲۰۱۲، آخرین ویرایش، یونیکد ۶٫۱ است.
موفقیت یونیکد در یکی کردن کدبندی نویسهها سبب استفاده گسترده اش در جهانیسازی و بومیسازی نرم افزارها شدهاست. این استاندارد در بسیاری از فناوریهای اخیر پیاده شدهاست از جمله: اکس ام ال، زبان برنامه نویسی جاوا، چارچوب دات نت مایکروسافت و سیستم عاملهای مدرن.
یونیکد میتواند توسط رمزنگاری نویسههای مختلفی پیاده سازی شود. پرکاربرد ترین رمز نگاریها عبارت اند از: UTF-8، و UCS-2 که دیگر اعتبار ندارد، و UTF-16.
رمزنگاری UTF-8 برای رمزنگاری نویسههای موجود در استاندارد اسکی تنها ۱ بایت استفاده میکند.کد نویسههای موجود در رمز نگاری اسکی، در هر دو رمزنگاری یکی است. این رمز نگاری حداکثر ۴ بایت برای هر نویسه استفاده میکند.UCS-2 برای تمام نویسهها از ۲ بایت استفاده میکند بنابراین نمیتواند تمام نویسههای موجود در استاندارد فعلی یونیکد را رمزنگاری کند. UTF-16 رمزنگاری UCS-2 را گسترش میدهد و برای نویسههای باقیمانده از ۴ بایت استفاده میکند.
محتویات |
تاریخچه و توسعه[ویرایش]
هدف یونیکد رفع محدودیتهای موجود در کدبندی نویسههای قدیمی است، مانند کدبندیهایی که بر پایه استاندارد ISO 8859 تعریف شدهاند، که استفاده گستردهای در کشورهای مختلف پیدا کردهاند، ولی با یکدیگر سازگار نیستند. بسیاری از کدبندیهای قدیمی این مشکل مشترک را دارند که امکان پردازش متنهای دوزبانه(معمولا به وسیله نویسههای لاتین و نمادهای محلی) را فراهم میکنند، ولی پردازش بیش از دو زبان را ممکن نمیکنند.
نقش یونیکد در پردازش متن این است که به جای یک تصویر برای هر نویسه یک کد منحصر به فرد ارایه میکند. به عبارت دیگر، یونیکد یک نویسه را به صورت مجازی ارایه میکند و کار ساخت تصویر(شامل اندازه، شکل، قلم، یا سبک) نویسه را به عهده نرم افزار دیگری مانند مرورگر وب یا واژهپرداز میگذارد.
یونیکد در ویندوز[ویرایش]
در ویندوز ایپیآی توابع یونیکد با پسوند W میآیند. (مثال: CreateWindowExW) پسوند W حرف اول عبارت wide character است که در زبانهای برنامه نویسی انواع دادهای که یونیکد را پشتیبانی میکنند اسامی مشابهی مانند WCHAR دارند و گاهی به آن نویسهٔ چندبایتی (به انگلیسی: multibyte character) نیز گفته میشود.
همکاران ایرانی[ویرایش]
روزبه پورنادر[۳] (دانشگاه شریف)، بهداد اسفهبد[۴][۵] (دانشگاه شریف)، هومن پورناصح[۶] (مایکروسافت) و کمیل بهمنپور[۷][۸] (چرتکه) از جمله ایرانیانی هستند که در توسعهٔ استاندارد یونیکد بخصوص در زبانهای راست به چپ فارسی، عربی و عبری به کنسرسیوم یونیکد، تولیدکنندگان سیستمعامل، و شرکتهای فعال در این زمینه کمک شایانی کردهاند.
همچنین بخوانید[ویرایش]
ویکیپدیا:خط فارسی را پاس بداریم
پیوند به بیرون[ویرایش]
پانویس[ویرایش]
- ↑ "Unicode Transcriptions". The Unicode Consortium. 2011-11-11. Retrieved 2012-02-22.
- ↑ Unicode Standard
- ↑ «دربارهٔ سخنرانان کنفرانس یونیکد» (انگلیسی). کنفرانس یونیکد. بازبینیشده در ۲۰ ژوئیهٔ ۲۰۰۹.
- ↑ «بهداد اسفهبد، پروژهٔ فارسی وب» (انگلیسی). کنسرسیوم یونیکد. بازبینیشده در ۱۰ ژوئیهٔ ۲۰۰۹.
- ↑ «صفحهٔ شخصی بهداد اسفهبد» (انگلیسی). بهداد اسفهبد. بازبینیشده در ۱۰ ژوئیهٔ ۲۰۰۹.
- ↑ «نوزدهمین همایش بین المللی یونیکد» (انگلیسی). کنسرسیوم یونیکد. بازبینیشده در ۱۰ ژوئیهٔ ۲۰۰۹.
- ↑ «چرتکه راضی از برنامهٔ تحقیق و توسعهٔ آفیس اینفوپت» (انگلیسی). ئیفرمز نیوز، ۵ نوامبر ۲۰۰۳. بازبینیشده در ۲۵ ژوئیهٔ ۲۰۰۹.
- ↑ «وبگاه رسمی کمیل بهمنپور» (فارسی). کمیل بهمنپور. بازبینیشده در ۱۰ ژوئیهٔ ۲۰۰۹.
منابع[ویرایش]
| در ویکیانبار پروندههایی دربارهٔ یونیکد موجود است. |
- «یونیکد چیست؟». ترجمهٔ روزبه پورنادر. کنسرسیوم یونیکد. بازبینیشده در ۱۰ ژوئیهٔ ۲۰۰۹.
- مشارکتکنندگان ویکیپدیا، «Unicode»، ویکیپدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۱۱ ژوئن ۲۰۰۹).
| این یک نوشتار خُرد پیرامون رایانه است. با گسترش آن به ویکیپدیا کمک کنید. |