الگوریتم مرتبسازی
این مقاله نیازمند ویکیسازی است. لطفاً با توجه به راهنمای ویرایش و شیوهنامه، محتوای آن را بهبود بخشید. |
الگوریتم مرتبسازی، در دانش رایانه و ریاضی، الگوریتمی است که فهرستی از دادهها را به ترتیبی مشخص میچیند.
پرکاربردترین ترتیبها، ترتیبهای عددی و واژهنامهای هستند. مرتبسازی کارا در بهینهسازی الگوریتمهایی که به فهرستهای مرتب شده نیاز دارند (مثل جستجو و ترکیب)، اهمیت زیادی دارد.
از آغاز علم رایانه مسائل مرتبسازی بررسیهای فراوانی را متوجه خود ساختند؛ شاید به این علت که در عین ساده بودن، حل آن به صورت کارا پیچیده است. برای نمونه مرتبسازی حبابی در سال ۱۹۵۶ به وجود آمد. در حالی که بسیاری این را یک مسئلهٔ حل شده میپندارند، الگوریتم کارآمد جدیدی همچنان ابداع میشوند (مثلاً مرتبسازی کتابخانهای در سال ۲۰۰۴ مطرح شد).
مبحث مرتبسازی در کلاسهای معرفی علم رایانه بسیار پرکاربرد است؛ مبحثی که در آن وجود الگوریتمهای فراوان به آشنایی با ایدههای کلی و مراحل طراحی الگوریتمهای گوناگون کمک میکند؛ مانند تحلیل الگوریتم، دادهساختارها، الگوریتمهای تصادفی، تحلیل بدترین و بهترین حالت و حالت میانگین، هزینهٔ زمان و حافظه، و حد پایین.
در این مقاله الگوریتمهای مرتبسازی را مقایسه و طبقه بندی میکنیم.
طبقهبندی
[ویرایش]در علم کامپیوتر معمولاً الگوریتمهای مرتبسازی بر اساس این معیارها طبقهبندی میشوند:
پیچیدگی (بدترین و بهترین عملکرد و عملکرد میانگین)
[ویرایش]با توجه به اندازهٔ فهرست (n). در مرتبسازیهای معمولی عملکرد خوب و عملکرد بد است. بهترین عملکرد برای مرتبسازی است. الگوریتمهایی که فقط از مقایسهٔ کلیدها استفاده میکنند در حالت میانگین حداقل مقایسه نیاز دارند.
سرعت الگوریتم مرتبسازی یکی از خصیصههای مهم الگوریتم است که به تعداد مقایسهها و همچنین تعداد تعویضهایی که باید انجام گیرد، بستگی دارد. سرعت اجرای بعضی از الگوریتمها با تعداد عناصر لیست نسبت توانی دارد و بعضی دیگر نسبت لگاریتمی. سرعت اجرای الگوریتم در بدترین و بهترین حالت نیز مهم است؛ زیرا ممکن است یکی از این دو حالت برای عمل مرتبسازی انتخاب گردد؛ ممکن است سرعت متوسط اجرای الگوریتم خوب باشد ولی در بدترین حالت سرعت اجرای آن خیلی کم باشد.
بعضی از الگوریتمهای مرتبسازی «در جا[۱]» هستند. یعنی به جز دادههایی که باید مرتب شوند، حافظهٔ کمی () مورد نیاز است؛ در حالی که سایر الگوریتمها به ایجاد مکانهای کمکی در حافظه برای نگهداری اطلاعات موقت نیاز دارند.
الگوریتمهای مرتبسازی پایدار ترتیب را بین دادههای دارای کلیدهای برابر حفظ میکنند. فرض کنید میخواهیم چند نفر را بر اساس سن با یک الگوریتم پایدار مرتب کنیم. اگر دو نفر با نامهای الف و ب همسن باشند و در لیست اولیه الف جلوتر از ب آمده باشد، در لیست مرتب شده هم الف جلوتر از ب است.
برای فهم این فاکتور مقایسه الگوریتمها (شرکت عناصر مساوی در مقایسه) تصور کنید که یک بانک اطلاعاتی از آدرس افراد موجود است. این بانک اطلاعاتی بر اساس کد پستی و در داخل کد پستی بر اساس نام افراد مرتب است. اگر آدرس جدیدی به بانک اطلاعاتی اضافه گردد و این بانک اطلاعاتی بر اساس کد پستی مرتب گردید، نباید مجدداً بر اساس نام مرتب شود برای تضمین این مطلب الگوریتم مرتبسازی نباید جای دو کلید مساوی را تعویض نماید.
مقایسهای بودن یا نبودن
[ویرایش]در یک مرتبسازی مقایسهای دادهها فقط با مقایسه به وسیلهٔ یک عملگر مقایسه، مرتب میشوند.
همسنجی سریع
[ویرایش]جدول زیر مربوط به الگوریتمهای تطبیقی است. به کمک درخت تصمیم میتوان ثابت کرد حداقل زمان مرتبسازی با روش مقایسه در حالت میانگین، میباشد.
نام | میانگین | بدترین | حافظه | پایداری | روش | نکات اضافه |
---|---|---|---|---|---|---|
مرتبسازی حبابی | بله | تعویض | کد کوتاه | |||
مرتبسازی حبابی دوسویه | — | بله | تعویض | |||
مرتبسازی شانهای | — | — | خیر | تعویض | کد کوتاه | |
مرتبسازی گورزاد | — | بله | تعویض | کد کوتاه | ||
مرتبسازی انتخابی | بستگی دارد | انتخاب | پایدار بودن آن به پیادهسازی بستگی دارد | |||
مرتبسازی درجی | بله | درج | حالت میانگین همچنین میباشد که d تعداد درجهاست. | |||
مرتبسازی شل | — | خیر | درج | |||
مرتبسازی درختی | بله | درج | باید از یک درخت دودویی جستجوگر خود متوازن استفاده شود | |||
مرتبسازی کتابخانهای | بله | درج | ||||
مرتبسازی ادغامی | بله | ادغام | ||||
مرتبسازی ادغامی درجا | بستگی دارد | ادغام | نمونه پیادهسازی اینجا: [۳]؛ میتواند به عنوان یک مرتبسازی پایدار پیادهسازی شود: [۴] | |||
مرتبسازی هرمی | خیر | انتخاب | ||||
مرتبسازی روان | — | خیر | انتخاب | |||
مرتبسازی سریع | بستگی دارد | تقسیمبندی | با توجه به شیوهای که محور عمل میکند، میتواند به صورت پایدار پیادهسازی شود؛ گونهٔ دیگری از آن از حافظه استفاده میکند. | |||
مرتبسازی درونگرا | خیر | مرکب | استفاده شده در پیادهسازیهای SGI STL | |||
مرتبسازی شکیبانه | — | خیر | درج و انتخاب | بزرگترین زیردنبالههای افزایشی را با پیدا میکند. | ||
مرتبسازی رشتهای | بله | انتخاب | ||||
مرتبسازی مسابقهای | انتخاب |
جدول زیر مربوط به الگوریتمهای ناتطبیقی است. این الگوریتمها محدودیت الگوریتمهای تطبیقی را ندارند. اندازه کلیدها و مقداری است که در پیادهسازی استفاده شدهاست. خیلی از این الگوریتمها بر این فرض استوارند که سایز کلیدها به قدری بزرگ است که همهٔ کلیدها مقدار یکسانی دارند. و یعنی "خیلی کمتر از".
نام | میانگین | بدترین | حافظه | پایداری | n << 2k | نکات دیگر |
---|---|---|---|---|---|---|
مرتبسازی لانهکبوتری | بله | بله | ||||
مرتبسازی سطلی | بله | خیر | فرض میکند عناصر در محدودهٔ خود یکنواخت پخش شدهاند. | |||
مرتبسازی شمارشی | بله | بله | اگر k = آنگاه میانگین = | |||
مرتبسازی مبنایی کم ارزشترین رقم | بله | خیر | ||||
مرتبسازی مبنایی پرارزشترین رقم | خیر | خیر | ||||
مرتبسازی گسترده | خیر | خیر |
الگوریتمهای مرتبسازی تطبیقی
[ویرایش]مرتبسازی حبابی
[ویرایش]درباره
[ویرایش]سادهترین الگوریتم مرتبسازی از لحاظ پیادهسازی میباشد. این الگوریتم هر بار دو خانه مجاور را باهم مقایسه کرده، اگر ترتیب آنها درست نبود، جای آنها را عوض میکند و یک خانه جلو میرود. به این ترتیب پس از یک بار پیمایش آرایه یک خانه در جای درست خود قرار میگیرد و این کار تا زمانی که لیست کاملاً مرتب شود ادامه مییابد. دلیل نامگذاری آن نیز از این رو است که حرکت یک کلید به سمت مکان نهایی آن شبیه پویش حباب به بالای مایع است.
مقایسه
[ویرایش]در مرتبسازی حبابی موقعیت عناصر درون لیست نقش بسزایی در تعیین عملکرد آن دارد. از آنجایی که عناصر بزرگ در ابتدای لیست به سرعت جابجا (swap) میشوند، مشکل چندانی در سرعت عملکرد الگوریتم ایجاد نمیکنند. اگر چه عناصر کوچک نزدیک به آخر لیست (که باید به سمت ابتدای لیست بیایند) بسیار کند حرکت میکنند. این تفاوت در سرعت به حدی است که به عناصر بزرگ، لاکپشتها و به عناصر کوچک، خرگوشها میگویند.
تلاش بسیاری انجام شده که سرعت حرکت لاکپشتها در مرتبسازی حبابی افزایش یابد. از جمله میتوان از مرتبسازی کوکتلی نام برد که در این زمینه بسیار خوب عمل میکند ولی بدترین زمان اجرای آن هنوز است. مرتبسازی شانهای عناصر بزرگ با فاصلههای زیاد را مقایسه میکند و لاکپشتها را با سرعت فوق العادهای حرکت میدهد، سپس با کمتر و کمتر کردن این فاصلهها لیست را به سرعت مرتب میکند؛ بهطوریکه سرعت متوسط آن قابل مقایسه با الگوریتمهای پر سرعتی مثل مرتبسازی سریع (Quick Sort) میباشد.
علی رغم پیادهسازی ساده، مرتبسازی حبابی در عمل در مقایسه با الگوریتمهای دیگری که پیچیدگی دارند، کارایی کمتری دارد. تا جایی که تحقیقات نشان میدهد مرتبسازی حبابی در عمل ۵ برابر کندتر از مرتبسازی درجی و ۴۰ درصد کندتر از مرتبسازی انتخابی میباشد.
گونههای دیگر
[ویرایش]مرتبسازی زوج و فرد، پیادهسازی موازی مرتبسازی حبابی است که در سیستمهای انتقال پیام قابل استفاده میباشد.
مرتبسازی انتخابی
[ویرایش]درباره
[ویرایش]یک الگوریتم تطبیقی ساده دیگر برای مرتبسازی یک لیست، مرتبسازی انتخابی است. شیوه مرتب کردن آن به این صورت است که در هر مرحله کوچکترین (یا بزرگترین) عنصر آرایه را با مییابد و آن را به مکان خود میبرد. بعد دومین عنصر کوچک (یا بزرگ) و به همین ترتیب ادامه میدهد تا آرایه مرتب شود.
مقایسه
[ویرایش]در بین الگوریتمهای هم مرتبه، مرتبسازی انتخابی عموماً سریع تر از مرتبسازی حبابی و مرتبسازی گورزاد عمل میکند. اما در مقایسه با مرتبسازی درجی کندتر است (با یک محاسبهٔ ساده، مرتبسازی درجی حدودا نصف مقایسههای مرتبسازی انتخابی را انجام میدهد). در عمل، این الگوریتم برای مرتبسازی یک لیست کوچک، الگوریتمی نسبتا کارا بهشمار میرود. نمودار کارایی الگوریتم برحسب ورودیها را در زیر میبینید:
گونههای دیگر
[ویرایش]پیادهسازی دوطرفهٔ مرتبسازی انتخابی، مرتبسازی کوکتلی نامیده میشود که در هر پیمایش عنصر کمینه و بیشینه را با هم پیدا میکند. این کار تعداد پیمایشها را به نصف کاهش داده اما تعداد مقایسهها و جابهجاییها را کاهش نمیدهد. البته مرتبسازی کوکتلی غالبا به عنوان گونهٔ تغییر یافتهٔ مرتبسازی حبابی شناخته میشود.
Bingo sort نیز گونهٔ تغییریافتهٔ دیگری از مرتبسازی انتخابی است، برای زمانی که دادههای تکراری زیادی میان ورودیها وجود داشته باشد. این الگوریتم کلیدها را برحسب تعداد تکرارشان مرتب میکند تا به بزرگترین کلید برسد، سپس آن کلیدها را به تعداد تکرارشان به مکان نهایی خود میبرد، مثل مرتبسازی شمارشی. در واقع مرتبسازی انتخابی برای انتقال یک مقدار به مکان نهایی خود یک پیمایش بر روی دادههای باقیمانده انجام میدهد. در حالی که در Bingo sort برای هر کلید (value و نه Item) دو بار پیمایش انجام میشود. یک بار برای یافتن کلید بزرگتر بعدی و یک بار برای انتقال تمام خانهها با آن کلید به محل نهاییشان. بنابراین اگر بهطور متوسط، از هر کلید ۲ تکرار یا بیشتر داشته باشیم، Bingo sort عموماً سریعتر عمل خواهد کرد.
مرتبسازی درجی
[ویرایش]درباره
[ویرایش]الگوریتم سادهای از لحاظ پیادهسازی است که در هر مرحله یک عنصر را برداشته و در محل مناسبش در میان دادههایی که در مراحل قبلی مرتب شدهاند، درج میکند.
مقایسه
[ویرایش]این الگوریتم در عمل از بسیاری از الگوریتمهای هممرتبه خود مثل مرتبسازی حبابی و مرتبسازی انتخابی بهتر عمل میکند و متوسط زمان اجرای آن میباشد و برای تعداد ورودیهای کم، الگوریتم کارایی محسوب میشود. همچنین برای مرتبسازی مجموعهای از دادههای تقریباً مرتب کارآمد است. اگر تعداد وارونگیها، d باشد، این الگوریتم دارای زمان اجرای O(n)+d خواهد بود.
بهترین ورودی برای آن دادههای مرتب و بدترین ورودی آرایهای است که به صورت معکوس مرتب شده باشد.
در حالت کلی، مرتبسازی درجی در آرایه بار عمل نوشتن انجام میدهد؛ درحالیکه مرتبسازی انتخابی تنها بار مینویسد. به همین دلیل مرتبسازی انتخابی در مواردی که نوشتن در حافظه نیازمند هزینه زیادی باشد، سریعتر عمل میکند مانند نوشتن در فلش مموری.
برخی الگوریتمهای حل و تقسیم، مثل مرتبسازی ادغامی یا مرتبسازی سریع که با تقسیم لیست به صورت بازگشتی به زیرلیستهای مرتب شده، عمل مرتبسازی را انجام میدهند. یک راه بهینهسازی برای این الگوریتمها، استفاده از مرتبسازی درجی برای مرتب کردن زیرلیستهای کوچک است که در کل موجب تسریع الگوریتم میشود. سایز زیرلیستهایی که استفاده از مرتبسازی درجی برای آنها کارایی بهتری دارد حدودا بین ۸ تا ۲۰ عنصر است.
گونههای دیگر
[ویرایش]مرتبسازی درجی دودویی، گونهای از مرتبسازی درجی است که در آن برای یافتن محل مناسب هر عنصر از جستجوی دودویی استفاده میشود. این الگوریتم برای زمانی که هزینهٔ مقایسهها از هزینهٔ جابهجاییها بیشتر باشد، مانند زمانی که لیست ورودی مرتب شدهاست، مناسبتر میباشد.
D.L.Shell مرتبسازی درجی را با الگوریتمی تحت عنوان مرتبسازی شل بهبود بخشید. این الگوریتم مرتبسازی را با مقایسه دو عنصر که فاصله آنها از هم در هر مرحله کم میشود، انجام میدهد. مرتبسازی شل پیچیدگی الگوریتم را در عمل بهطور قابل توجهی افزایش داده که در دو نسخه مختلف با و عمل میکند.
گونهٔ تغییریافتهٔ دیگری از مرتبسازی درجی در سال ۲۰۰۶ با نام مرتبسازی کتابخانهای طراحی شد که در آن تعداد کمی فضای بدون استفاده در سراسر آرایه پخش میشود. این کار باعث تسریع شدن درجهای بعدی میشود. طراحان ثابت کردهاند که این الگوریتم با احتمال زیادی در زمان اجرا میشود.
مرتبسازی گورزاد نیز الگوریتم دیگری است که با تغییر کوچکی در مرتبسازی درجی ایجاد شده است؛ به این ترتیب که در هر مرحله برای درج عنصر به جای شیفت دادن از جابهجایی تعدادی از عناصر مجاور استفاده میشود، مثل مرتبسازی حبابی.
مرتبسازی ادغامی
[ویرایش]درباره
[ویرایش]این مرتبسازی به طریقهٔ تقسیم و حل، لیست را مرتب میکند. به این صورت که آرایه را به دو لیست با اندازهٔ تقریباً مساوی تقسیم کرده، هر زیر لیست را به صورت بازگشتی مرتب و سپس با هم ادغام میکند.
مقایسه
[ویرایش]مرتبهٔ این الگوریتم از حل رابطهٔ بازگشتی حاصل میشود. در بدترین حالت، تعداد مقایسههای آن تقریباً میباشد که در حالت متوسط مقدار آن a.n تا کم میشود که در آن a=0.2645.
تعداد مقایسههای مرتبسازی ادغامی در بدترین حالت حدود ۰٫۳۹ کمتر از مرتبسازی سریع در حالت متوسط است. بدترین حالت مرتبسازی ادغامی زمانی اتفاق میافتد که کلید تمام عناصر با هم برابر باشند. لازم است ذکر شود این حالت برای مرتبسازی سریع بهترین حالت است! در پیادهسازی بازگشتی آن تابع مرتبسازی در بدترین حالت ۲n-1 بار صدا زده میشود، در حالی که در مرتبسازی سریع n بار صدا زده میشود.
پیادهسازی معمولی مرتبسازی ادغامی به صورت غیردرجا و با حافظه کمکی n است (البته پیادهسازیهایی نیز وجود دارد که به صورت غیر درجاست اما به n/2 حافظه اضافی نیاز دارد). پیادهسازی درجای آن (بدون نیاز به حافظه کمکی) نیز امکانپذیر است اما پیچیده بوده و در عمل کارایی آن را کاهش میدهد. مرتبسازی ادغامی درجا برخلاف نوع ساده آن لزوما پایدار نیست.
در مقایسه مرتبسازی ادغامی با دیگر الگوریتمها، میتوان گفت اگر چه در اکثر موارد از مرتبسازی هرمی کندتر عمل میکند و همچنین حافظهٔ بیشتری میگیرد و اگر چه در یک نگاه کلی مرتبسازی سریع به عنوان سریعترین الگوریتم مرتبسازی شناخته میشود، اما مرتبسازی ادغامی یک مرتبسازی پایدار است که اجرای موازی آن بهتر عمل میکند و همچنین اغلب بهترین انتخاب برای مرتبسازی یک لیست پیوندی است. زیرا اجرای مرتبسازی هرمی روی آن غیرممکن و اجرای مرتبسازی سریع کارایی چندانی ندارد.
در جاوا، دستور Array.sort() یا از مرتبسازی ادغامی استفاده میکند یا از یک نوع مرتبسازی سریع وابسته به نوع داده؛ که برای کارایی بیشتر هنگامی که کمتر از ۷ ورودی داریم به مرتبسازی درجی تغییر میکند.
پایتون نیز از مرتبسازی تیم (به انگلیسی: Timsort) استفاده میکند که ترکیبی از مرتبسازی ادغامی و درجی میباشد.
مرتبسازی هرمی
[ویرایش]درباره
[ویرایش]این مرتبسازی که از خانواده مرتبسازی انتخابی محسوب میشود، ابتدا داخل آرایه یک هرم بیشینه (یا کمینه) میسازد، سپس بزرگترین مقدار را در انتهای آرایه قرار میدهد. سپس با اعداد باقیمانده دوباره این عمل را انجام میدهد. بزرگترین مقدار را در هرم یافته و در مکان درست خود قرار میدهد و این کار را تا زمانی که هرم خالی شود انجام میدهد.
مقایسه
[ویرایش]این الگوریتم که یک مرتبسازی غیرپایدار اما درجاست، در بدترین حالت دارای پیچیدگی میباشد و پیادهسازی آن برخلاف مرتبسازی سریع به صورت بازگشتی نیست.
در مقایسه با مرتبسازی سریع، معمولاً مرتبسازی سریع، کارایی بیشتری از خود نشان میدهد اما بدترین حالت آن میباشد که آن را برای تعداد زیادی داده، ناکارآمد میکند.
گونههای دیگر
[ویرایش]مرتبسازی درونگرا، یک الگوریتم مرتبسازی جالب برای ترکیب مرتبسازی سریع و هرمی است، به نحوی که برتریهای هر دو را در خود جای دهد: سرعت مرتبسازی هرمی در حالت بد و سرعت مرتبسازی سریع در حالت میانگین.
در مقایسه با مرتبسازی ادغامی، معمولاً در دستگاههایی که حافظه نهان (Cache) کمتری دارند، مرتبسازی هرمی سریعتر عمل میکند. از طرف دیگر مرتبسازی ادغامی چندین مزیت بر مرتبسازی هرمی دارد. از جمله این که پایدار است، موازیسازی آن بهتر صورت میگیرد و قابل پیادهسازی روی لیست پیوندی است. الگوریتم مرتبسازی هرمی مبنای ۳ نیز دقیقا شبیه الگوریتم مذکور است با این تفاوت که به جای یک هرم دودویی از یک هرم سهسهیی استفاده میکند. به این معنا که هر عنصر میتواند ۳ فرزند داشته باشد. پیادهسازی این الگوریتم مشکل است اما به تعداد ثابتی عمل مقایسه و جابجایی را کاهش میدهد. این روش حدود ۱۲% سریعتر از حالت معمولی مرتبسازی هرمی عمل میکند.
نوع دیگری از مرتبسازی هرمی با استفاده از درخت دکارتی انجام میشود که عنصر را تا زمانی که کلیدهای کوچکتر در دو طرف آن گره، درون خروجی مرتب شده قرار نگرفته باشند، درون هرم اضافه نمیکند. به این ترتیب اثبات میشود که الگوریتم برای ورودیهایی که از قبل تقریباً مرتب شدهاند سریعتر از عمل میکند.
به خاطر حد بالای ثابت اجرای آن و همچنین حافظهٔ کمکی ثابت، در سیستمهای تعبیه شده که محدودیت زمانی دارند یا سیستمهای امنیتی از این مرتبسازی استفاده میکنند.
مرتبسازی سریع
[ویرایش]درباره
[ویرایش]یکی از روشهای مرتبسازی است که به علت مصرف کم حافظه، سرعت اجرای مناسب و پیادهسازی ساده، بسیار مورد توجه و محبوب واقع شدهاست. این روش در ۱۹۶۰ توسط ریچارد هواره که بر روی ماشین ترجمه کار میکرد، برای مرتبسازی کلماتی که باید ترجمه میشدند، طراحی شد. هر پیادهسازی این روش، از دو بخش تقسیمبندی آرایه و مرتبسازی تشکیل شدهاست و برای هر تقسیمبندی نیاز به یک محور دارد. پس از انتخاب محور، دادهها نسبت به آن مرتب میشوند یعنی همه دادههای بزرگتر در یک طرف و دادههای کوچکتر در طرف دیگر قرار میگیرند. با مرتبسازی بازگشتی این دو قسمت کل دادهها مرتب میشوند. برخلاف مرتبسازی ادغامی در این روش نیازی به ادغام این دو بخش نیست چرا که همه دادههای قسمت چپ از دادههای قسمت راست کوچکتر است.
این روش در واقع گونهای مرتبسازی درخت دودویی است که از لحاظ حافظه بهینه شدهاست.
مقایسه
[ویرایش]بهترین حالت برای این الگوریتم زمانی اتفاق میافتد که محور در وسط واقع شود، در این صورت این الگوریتم در و سریع تر از الگوریتمهای دیگر اجرا میشود.
بدترین حالت زمانی است که محور پس از تقسیم در ابتدا یا انتهای آرایه قرار گیرد. که در این حالت زمان اجرای آن خواهدبود.
پیادهسازی آن به صورت تصادفی، محور را در هر مرحله به شکل تصادفی انتخاب میکند. پیادهسازی آن برای لیست پیوندی معمولاً کارا نیست زیرا به دلیل نبود دسترسی تصادفی، محور خوبی نمیتوان انتخاب کرد.
مرتبسازی سطلی که با دو سطل انجام شود، بسیار شبیه مرتبسازی سریع است. محور در این مورد، عنصر میانی کلیدهاست. این عمل، حالت میانگین را برای ورودیهای بهطور یکنواخت توزیع شده، به خوبی اصلاح میکند.
این الگوریتم در عمل برای مرتبسازی آرایههای نسبتا کوچک اصلا مناسب نیست. به علاوه بخش تقسیمبندی آرایه نیز مشکل بزرگی در زمان اجرا میباشد. به همین دلیل پیشنهاد میشود برای ۷ داده یا کمتر از انواع دیگر مرتبسازی مثل مرتبسازی درجی استفاده شود؛ به علاوه به جای پیادهسازی بخش تقسیمبندی برای بیش از ۴۰ داده میتوان از میانهٔ ۹، برای کمتر از ۴۰ داده از میانهٔ ۳ و برای آرایههای بسیار کوچک از عضو وسط استفاده کرد.
این مرتبسازی را نیز میتوان مثل مرتبسازی ادغامی به صورت موازی اجرا نمود. اگر n پردازنده داشته باشیم، میتوان با ، n عنصر را به p زیرلیست تقسیم نمود، سپس هر بخش را با مرتب کرد. یک مزیت پیادهسازی موازی آن این است که نیازی به همگامسازی نیست و وقتی که زیرلیستها آماده شد، اجرای هر بخش کاملاً مستقل از بخشهای دیگر است. این مرتبسازی، برای اجرا بر روی معماریهای کامپیوتری امروزی بسیار مناسب است و از سلسله مراتب حافظه، بهترین استفاده را میکند. پیادهسازی بسیار خوبی از این الگوریتم را میتوانید در کد منبع جاوا، در کتابخانهٔ java.util.array مشاهده نمایید.
الگوریتمهای مرتبسازی ناتطبیقی
[ویرایش]مرتبسازی مبنایی (پایهای)
[ویرایش]درباره
[ویرایش]الگوریتمی است که لیستی از داده با طول حداکثر را در مرتب میکند. به این صورت که ورودی را اگر رشته است به حروف سازنده اش و اگر عدد صحیح است به ارقامش شکسته و ابتدا کم ارزشترین (یا پرارزشترین) بخش آنها را مقایسه کرده، مرتب میکنیم، سپس بخش بعدی را مقایسه میکنیم و به همین ترتیب. برای مرتب کردن هر بخش میتوانیم از مرتبسازی شمارشی استفاده کنیم. اگر از کم ارزشترین بخش شروع کنیم به آن LSD radix sort میگویند و اگر از پرارزشترین قسمت شروع کنیم MSD radix sort.
مقایسه
[ویرایش]میتوان برای کارآمدتر کردن الگوریتم از صف به عنوان پیمانهها استفاده کرد، به این ترتیب که هر بار اعداد را برحسب رقمشان درون یک صف قرار دهیم. پس از پایان مرحله، دوباره اعداد را از صف درون آرایه بریزیم و این کار را برای رقمهای بعدی تکرار کنیم. این یک مدل ساده ولی نسبتا مناسب برای پیادهسازی الگوریتم است.
گفتیم که زمان اجرای مرتبسازی مبنایی میباشد. وقتی که از حدود باشد، ممکن است به نظر برسد که مرتبسازی مبنایی، برتری خاصی نسبت به الگوریتمهای تطبیقی مثل مرتبسازی ادغامی نداشته باشد. اما باید توجه داشت که پیچیدگی بهدست آمده برای این الگوریتمهای تطبیقی، در واقع تعداد مقایسههای دو عدد کامل را میشمارد و سریعترین زمان ممکن برای این مقایسه برابر است با k. بنابراین اگر ما تعداد عملیات بنیادین انجام شده را بشماریم، پیچیدگی مرتبسازی ادغامی از خواهد بود.
مرتبسازی شمارشی
[ویرایش]درباره
[ویرایش]یک الگوریتم ناتطبیقی است که با فرض صحیح بودن اعداد، از آرایهای به طول بازهٔ اعداد ورودی، برای شمردن تعداد تکرار هر عدد استفاده میکند (به این آرایه، آرایه شمارش میگویند) به عنوان مثال اندیس i در آرایه شمارشی، تعداد تکرار عنصر i در آرایه ورودی را نشان میدهد. از اعداد داخل این آرایه برای قرار دادن عناصر آرایه ورودی در آرایه خروجی استفاده میشود.
این الگوریتم در سال ۱۹۵۴ توسط هارولد سوارد طراحی شد.
مقایسه
[ویرایش]اگر کمینه آرایه ورودی صفر نبود، برای ساختن آرایه شمارشی باید اعضای آرایه ورودی را به نحوی شیفت دهیم که کوچکترین کلید آن، با اندیس اول آرایه شمارشی منطبق شود.
این مرتبسازی یک مرتبسازی پایدار، با پیچیدگی است که n طول آرایه ورودی و k طول آرایه شمارش میباشد.
برای این که الگوریتم کارآمد باشد، لازم است k از مرتبهٔ n باشد تا پیچیدگی نهایی آن از باشد.
انواع دیگر
[ویرایش]یک گونه تغییریافتهٔ مرتبسازی شمارشی، Tally sort است که در آن آرایه ورودی شامل کلیدهای تکراری نیست یا انتظار ما این است که در طول مرتب سازی، تکرارهای هر کلید از آرایه حذف شوند. در این مرتبسازی آرایه شمارشی به صورت آرایهای از بیت هاست و هر بیت در صورتی یک میشود که کلید آن در بین اعداد موجود باشد.
مرتبسازی لانه کبوتری
[ویرایش]درباره
[ویرایش]این الگوریتم که count sort نیز نامیده میشود (با counting sort اشتباه نشود) الگوریتمی است که برای مرتبسازی لیستی از عناصر که در آن تعداد عناصر (n) و تعداد کلیدهای ممکن (N) تقریباً با هم برابر باشد، بسیار مناسب است. مراحل انجام آن به این صورت است:
- 1- با گرفتن آرایه ورودی، آرایه کمکی از لانهها میسازیم، بهطوریکه هر لانه برای تعدادی از کلیدها در محدوده آرایه ورودی باشد.
- 2- با پیمایش آرایه اصلی، هر عنصر را در لانهای که با کلید آن عنصر مشابهت دارد قرار میدهیم. بنابراین هر لانه شامل عناصری با کلیدهای یکسان میشود.
- 3- با گذر از لانهها، عناصر خانههایی که خالی نیستند را در آرایه اصلی کپی میکنیم.
به عنوان مثال فرض کنید میخواهیم عناصر زیر را بر حسب کلیدهایشان مرتب کنیم:
- (5 , “hello”)
- (3 , “pie”)
- (8 , “apple”)
- (5 , “king”)
برای هر کلید بین ۳ تا ۸، یک لانه میسازیم، و عناصر را به شکل زیر درون لانهها قرار میدهیم:
- 3: (3 , “pie”)
- 4:
- 5: (5 , “hello”) , (5 , “king”)
- 6:
- 7:
- 8: (8 , “apple”)
حال با پیمایش لانهها آنها را درون آرایه اصلی قرار میدهیم.
تفاوت بین مرتبسازی لانه کبوتری و مرتبسازی شمارشی این است که در مرتبسازی شمارشی، آرایه کمکی شامل عناصر ورودی نیست و تنها تکرار آنها را میشمارد. مثلاً برای مثال قبل:
- 3: 1
- 4: 0
- 5: 2
- 6: 0
- 7: 0
- 8: 1
با استفاده از این اطلاعات ما میتوانیم با یکبار انتقال عناصر آرایه را مرتب کنیم، در صورتی که در مرتبسازی کبوتری دو انتقال لازم است، یکبار از آرایه اصلی به لانهها و یکبار از لانهها به آرایه نهایی.
برای آرایههایی که تعداد کلیدهای متفاوت آنها (N) خیلی بزرگتر از اندازه شان (n) باشد، مرتبسازی سطلی الگوریتمی است که در حافظه و زمان کارآمدتر عمل میکند.
مرتبسازی سطلی
[ویرایش]درباره
[ویرایش]Bucket sort یا Bin sort نوعی مرتبسازی ناتطبیقی است که آرایه را به تعدادی سطل تقسیمبندی میکند. سپس هر سطل به صورت مستقل مرتب میشود، یا با استفاده از الگوریتمهای متفاوت مرتبسازی یا با اعمال بازگشتی خود مرتبسازی سطلی.
صورتی از این مرتبسازی بر روی آرایه از اعداد در دو شکل زیر مشخص است.
این مرتبسازی در واقع از خانواده مرتبسازی مبنایی است و همچنین حالت تعمیم یافتهٔ مرتبسازی طبقهای است.
شکل اصلی پیادهسازی آن به این صورت است که پس از سطل بندی، هر سطل را با مرتبسازی درجی مرتب میکنیم، میتوان نشان داد که هر سطل تقریباً در زمان خطی مرتب میشود. اگرچه کارایی این الگوریتم به شیوه سطل بندی کردن بسیار وابسته است. اگر سطل بندی به گونهای باشد که کلیدهای زیادی درون یک سطل قرار بگیرند، مرتبسازی به کندی صورت میگیرد.
اما یک پیادهسازی متداول و بهینه آن است که عناصر را پس از سطل بندی به همان ترتیب در آرایه اصلی قرار دهیم و سپس روی آرایه، مرتبسازی درجی را اعمال کنیم. به این خاطر که زمان اجرای این مرتبسازی وابسته به فاصله هر عنصر از مکان نهاییش میباشد و فاصله دادهها از مکان نهایی پس از سطل بندی کاهش یافته، تعداد مقایسهها مقدار قابل توجهی کم میشود و بهره وری سلسله مراتب حافظه در مرتبسازی لیست افزایش مییابد.
انواع دیگر
[ویرایش]Shuffle sort گونهٔ تغییریافتهای از مرتبسازی سطلی است که در آن ۱/۸ ابتدایی دادهها از آرایه جدا میشود و بهطور جداگانه مرتب میشود. این عناصر n/8 سطل، برای ۷/۸ عنصر باقیماندهٔ آرایه ایجاد میکند. هر سطل مرتب میشود و سپس برای ساخت آرایه نهایی به هم الصاق میشود. این مرتبسازی به عنوان یک مرحله در J sort مورد استفاده قرار میگیرد.
مرتبسازی سطلی میتواند به عنوان نسخهٔ تغییریافتهٔ مرتبسازی شمارشی تلقی شود. اگر اندازهٔ هر سطل یک باشد، این دو مرتبسازی هم تراز هم قرار میگیرند. اندازهٔ متغیر سطلها در مرتبسازی سطلی، به آن اجازه استفاده از حافظه به جای میدهد که m تعداد کلیدهای متمایز است. به عبارت دیگر، این مرتب سازی، رفتار مرتبسازی شمارشی را در بدترین حالت که میباشد، بهبود میدهد.
مرتبسازی سطلی با دو سطل، در واقع پیادهسازی ای از مرتبسازی سریع است که محور همیشه میانهٔ دادهها انتخاب میشود. این شیوه برای دادههایی که به صورت یکنواخت پخش شدهاند کارآمد است اما شیوههای دیگر انتخاب محور، مثل انتخاب تصادفی، مقاومت و پایداری بیشتری در برابر دادههای مختلف ورودی، برای الگوریتم ایجاد میکند.
مرتبسازی ادغامی n – سویه نیز با تقسیم لیست ورودی به n زیرلیست و مرتبسازی آنها آغاز میشود. اگرچه در زیرلیستهای ایجاد شده توسط مرتبسازی ادغامی، محدوده کلیدها با هم اشتراک پیدا میکند و این سبب میشود که ترکیب زیرلیستهای آن به سادگی مرتبسازی سطلی نباشد و به جای آن از یک الگوریتم ادغام استفاده بشود، اما این هزینهٔ اضافی با آسان کردن مرحلهٔ تقسیم دادهها و همچنین هم اندازه کردن همهٔ زیرلیستها جبران میشود و در نهایت حد بالای زمان مرتبسازی را (یعنی در بدترین حالت) بهبود میدهد.
پیاده سازیها
[ویرایش]- پیادهسازی مرتبسازی حبابی به ۲۶ زبان
- پیادهسازی مرتبسازی انتخابی به ۱۰ زبان
- پیادهسازی مرتبسازی درجی به ۱۷ زبان
- پیادهسازی مرتبسازی ادغامی به ۱۵ زبان
- پیادهسازی مرتبسازی هرمی به ۸ زبان
- پیادهسازی مرتبسازی سریع به ۳۳ زبان