مرتب‌سازی سطلی

از ویکی‌پدیا، دانشنامهٔ آزاد
مرتب‌سازی سطلی
ردهالگوریتم مرتب‌سازی
ساختمان دادهآرایه
کارایی بدترین حالت
کارایی متوسط
پیچیدگی فضایی

مرتب‌سازی سطلی (به انگلیسی: bucket sort)، یا مرتب‌سازی صندوقی، نوعی الگوریتم مرتب‌سازی است که با تقسیم کردن یک آرایه به تعدادی سطل کار می‌کند. سپس هر سطل به‌طور جداگانه مرتب می‌شود که این کار مرتب کردن می‌تواند از یک الگوریتم مرتب‌سازی دیگر استفاده کرده یا مرتب‌سازی سطلی را به‌طور بازگشتی روی آن اجرا کند. مرتب‌سازی سطلی تعمیم مرتب‌سازی لانه کبوتری است. از آن جایی که این مرتب‌سازی، مرتب‌سازی مقایسه‌ای نیست، نمی‌توان (Ω(nlog n را به عنوان کران پایین برای آن در نظر گرفت. پیچیدگی محاسباتی برای آن بر اساس تعداد سطل‌ها محاسبه می‌شود. ایده اصلی مرتب‌سازی سطلی این است که بازه ی(۱و۰]را به n زیر بازه با اندازهٔ یکسان تقسیم، یا سطل بندی و سپس n عدد ورودی را درون سطل‌ها پخش کند.

نحوه عملکرد[ویرایش]

شکل (۱)
عناصر در سطل‌ها توزیع می‌شوند.
شکل (۲)
عناصر در هر سطل مرتب می‌شوند.

مرتب‌سازی سطلی به صورت زیر کار می‌کند:

  • آرایه‌ای به عنوان سطل‌های خالی تعریف می‌کند.
  • پخش کردن: روی آرایه اصلی حرکت می‌کند و هر عنصر را در سطلش قرار می‌دهد. (شکل (۱))
  • هر سطل غیر خالی را مرتب می‌کند. (شکل (۲))
  • جمع‌آوری کردن: به ترتیب سطل‌ها را نگاه می‌کند و همه عناصر را به آرایه اصلی بازمی‌گرداند.

یک راه بهینه‌سازی مرسوم این است که ابتدا عناصر را در آرایه اصلی قرار داده، سپس مرتب‌سازی درجی را روی کل آرایه اجرا کند. چون زمان اجرای مرتب‌سازی درجی به این که هر عنصر از جای نهاییش چقدر فاصله دارد، بستگی داشته، تعداد مقایسه‌ها نسبتاً کم باقی می‌ماند و همچنین سلسله مراتب حافظه با مرتب کردن لیست به‌طور متصل در حافظه، بهتر به کار گرفته می‌شود.
مرسوم‌ترین نوع مرتب‌سازی سطلی روی لیستی با طول n عمل می‌کند که ورودی‌ها بین صفر و مقدار ماکسیممی مانند M هستند. سپس بازهٔ مقادیر را به n سطل هر کدام با طول M/n تقسیم می‌کند. اگر هر سطل با استفاده از مرتب‌سازی درجی مرتب شود، می‌توان نشان داد که مرتب‌سازی در زمان مورد خطی مورد انتظار اجرا می‌شود. (که میانگین زمان اجرا را روی هر ورودی ممکن می‌دهد) با این وجود، کارایی این مرتب‌سازی، زمانی که عناصر نزدیک به هم قرار می‌گیرند، تنزل پیدا می‌کند. در این حالت همه عناصر در یک سطل قرار می‌گیرند و مرتب‌سازی به کندی انجام می‌گیرد.

الگوریتم[ویرایش]

مرتب‌سازی سطلی به‌طور میانگین (زمانی که داده‌ها به صورت یکنواخت توزیع شده باشند) در زمان خطی اجرا می‌شود. فرض می‌شود که داده‌ها با یک فرایند تصادفی که عناصر را به‌طور یکنواخت روی بازه (۰٬۱] توزیع می‌کند.
ایده مرتب‌سازی سطلی این است که بازه (۰٬۱] را به n زیر بازه یا سطل با طول مساوی تقسیم می‌کند و n عدد ورودی را داخل سطل‌ها توزیع می‌کند. از آن جایی که ورودی‌ها به‌طور یکنواخت روی (۰٬۱] توزیع شده‌اند، ما انتظار نداریم که اعداد زیادی در یک سطل قرار بگیرند. برای تولید خروجی، اعداد هر داده را (با استفاده از مرتب‌سازی درجی) مرتب کرده و سپس به ترتیب روی سطل‌ها حرکت کرده و عناصر داخل هر کدام را لیست می‌کنیم.

  BUCKET_SORT (A)
  1. n ← length [A]
  2. For i = 1 to n do
  3. Insert A[i] into list B[nA[i]]
  4. For i = 0 to n-1 do
  5. Sort list B with Insertion sort
  6. Concatenate the lists B[0], B[1],.. B[n-1] together in order.

و الگوریتم در زبان C[ویرایش]

 void bucketSort(int a[],int n, int max)
 {
 int* buckets = new int[max];
 int SIZE = n;
 for(int j = 0 ; j <= max ; j++)
 buckets[j] = ۰;
 for(int i = 0 ; i < SIZE ; i++)
 ++buckets[a[i]];
 for(i = 0 , j = 0 ; j <= max ; ++j)
 for(int k = buckets[j] ; k > 0 ; k--)
 a[i++] = j;

}

کد ما برای مرتب‌سازی سطلی فرض می‌کند که ورودی در آرایه n عنصری A قرار دارد و هر عنصر A بین ۰ و ۱ است. همچنین ما به یک آرایه کمکی[B[0.. n -1 برای لیست‌های پیوندی مربوط به سطل‌ها نیاز داریم.
برای آن که ببینیم این الگوریتم کار می‌کند، دو عنصر [A[i و [A[j را در نظر بگیرید. بدون از دست دادن کلیت مسئله فرض کنید که [A[i]≤ A[j. عنصر [A[i می‌تواند در سطلی همانند [A[j قرار بگیرد یا به سطلی با اندیس کوچکتر برود. اگر [A[iو [A[j در سطلی یکسان قرار گیرند، حلقه for دوم آن‌ها را در ترتیب درست قرار می‌دهد. اگر [A[i و [A[j در سطل‌های متفاوت باشند، آنگاه خط آخر کد، آن‌ها را در جای درست می‌گذارد. بنا براین، مرتب‌سازی سطلی درست کار می‌کند.

مثالی از نحوه مرتب‌سازی[ویرایش]

عملیات مرتب‌سازی سطری

آرایه [A[1..10 داده شده‌است. آرایه [B[0..9 آرایه‌ای از لیست‌های مرتب شده یا سطل‌ها پس از خط پنجم کد است. سطل i مقادیری در بازه [i/10, (i +1)/10] را نگاه داشته‌است. خروجی مرتب شده شامل یک الحاق به ترتیب لیست‌ها است که در ابتدا [B[0 بعد [B[1] بعد [B[2 و...... در انتها[B[9 می‌آیند.
زمان اجرای این مرتب‌سازی این گونه بدست می‌آید:
زمان وارد کردن n عنصر در آرایه A + زمان حرکت روی آرایه کمکی B (مرتب شده با مرتب‌سازی درجی)
که زمان این برابر می‌شود با: (O(n) + n. O(2 - 1/n) = O(n . بنابراین مرتب‌سازی سطلی در زمان خطی اجرا می‌شود.

پیاده‌سازی الگوریتم در ++C[ویرایش]

# include <iostream>
using namespace std;

void bucketSort(int a[],int n, int max)
{
int* buckets = new int[max];
int SIZE = n;

for(int j = 0 ; j <= max ; j++)
buckets[j] = ۰;

for(int i = 0 ; i < SIZE ; i++)
++buckets[a[i]];

for(int i = 0 , j = 0 ; j <= max ; ++j)
for(int k = buckets[j] ; k > 0 ; k--)
a[i++] = j;

for(int i = 0 ; i < SIZE ; i++)
cout << a[i] << "";

cout << "\n";
}

int main()
{
int a[] = {۲۵٬۵۴٬۷۳٬۱۱٬۸۳٬۵۲٬۲۳٬۹۱};
int elem = sizeof(a)/sizeof(int);

int max = a[0];
for(int i = 0 ; i < elem ; i++)
  if(a[i] > max)
  max = a[i];

bucketSort(a, elem, max);
system("pause>nul");
}

پیاده‌سازی الگوریتم در جاوا[ویرایش]

public class BucketSort {
public static void main(String[] args) {
int a[]=new int[]{2٬۵٬۷٬۱٬۸٬۵٬۲٬۹};
int elem=۱۰;
bucketSort(a,elem);
}
public static void bucketSort(int a[],int m){
int[] buckets = new int[m];

for(int j=0;j<m;j++)
buckets[j]=۰;
for(int i=0;i<a.length;i++)
++buckets[a[i]];
for(int i=0,j=0;j<m;++j)
for(int k=buckets[j];k>0;k--)
a[i++]=j;
for(int i=0;i<a.length;i++)
System.out.println(a[i]);
}
}

مقایسه با الگوریتم‌های مرتب‌سازی دیگر[ویرایش]

می‌توان مرتب‌سازی سطلی را حالتی کلی از مرتب‌سازی شمارشی در نظر گرفت؛ در واقع، اگر اندازه هر سطل ۱ باشد، مرتب‌سازی سطلی به مرتب‌سازی شمارشی تبدیل می‌شود. اندازه متغیر سطل‌ها در مرتب‌سازی سطلی اجازه می‌دهد که استفاده از حافظه جای O(M)از O(n) باشد، که M تعداد مقادیر متمایز است؛ در عوض رفتار مرتب‌سازی شمارشی در بدترین حالت O(n + M) خواهد بود. مرتب‌سازی سطلی با دو سطل نسخه‌ای قابل اجرا از مرتب‌سازی سریع است که مقدار pivot محور مقدار میانه‌ای از محدوده مقادیر انتخاب می‌شود. چون این انتخاب برای ورودی‌ها با توزیع یکنواخت قابل اجرا است، روش‌های دیگر انتخاب محور در مرتب‌سازی سریع مانند انتخاب تصادفی موجب مقاومت بیشتری برای دسته‌بندی کردن توزیع ورودی‌ها می‌شود. الگوریتم مرتب‌سازی ادغامی n_راهه هم با توزیع لیست به n زیر لیست و مرتب کردن هر کدام آغاز می‌شود؛ اگرچه زیرلیست‌هایی که با مرتب‌سازی ادغامی ایجاد شده‌اند شامل محدوده‌هایی می‌شوند که با یکدیگر هم پوشانی دارند و بنابراین نمی‌توانند دوباره به وسیلهٔ همان الحاق ساده‌ای که در مرتب‌سازی سطلی انجام دادیم، ترکیب شوند. به جای آن باید با یک الگوریتم ادغام در محل اصلی خود جای داده شوند. اگرچه، این هزینه افزودن در مرحله‌ای که پراکنده کردن ساده‌تر انجام شد، موازنه شده‌است و اینکه می‌توانیم مطمئن باشیم همه زیرلیست‌ها به یک اندازه‌اند، کران خوبی برای بدترین حالت ایجاد می‌کند. مرتب‌سازی رقمی بالا-پایین می‌تواند حالت خاصی از مرتب‌سازی سطلی باشد اگر حتماً هر دو محدوده مقادیر و تعداد سطل‌ها توانی از دو باشند. در نتیجه، اندازه هر سطل هم توانی از دو است، و این روش می‌تواند به‌طور بازگشتی بکار بسته شود. این مشیء می‌تواند به مرحله پخش کردن سرعت دهد، از این رو ما فقط نیاز داریم بیت پیشوند را به نمایندگی از هر عنصر بیازماییم، تا سطل آن را تعیین کنیم.

مرتب‌سازی Postman[ویرایش]

مرتب‌سازی Postman نوع دیگری از مرتب‌سازی سطلی است که برتری‌های ساختار سلسله مراتبی عناصر را دارد، و نوعاً با مجموعه‌ای از صفات توصیف می‌شود. این الگوریتمی است که ماشین‌های مرتب‌سازی نامه‌ها از آن در دفاتر پست استفاده می‌کنند: حالت‌های اولیه، سپس دفاتر پست، سپس مسیرها، وغیره… چون کلیدها با یکدیگر مقایسه نمی‌شوند، زمان مرتب‌سازی O(cn) است، که c وابسته به اندازه کلید و تعداد سطل هاست. این مشابه مرتب‌سازی پایه‌ای است که «بالا پایین،» یا «پرارزش‌ترین رقم اول» کار می‌کند.

انواع[ویرایش]

مرتب‌سازی بی قرار[ویرایش]

«مرتب‌سازی بی قرار» (به انگلیسی: Shuffle sort) نوعی از مرتب‌سازی سطلی است که مرتب‌سازی را با حذف نخستین 1/8 از n آیتِم شروع می‌کند، آن‌ها را به صورت بازگشتی مرتب می‌کند، سپس آن‌ها را در یک آرایه قرار می‌دهد. این کار n/8 «سطل‌ها» را می‌سازد تا 7/8 باقی‌مانده از آیتِم‌ها توزیع شود. هر «سطل» در یک آرایه مرتب‌شده بهم می‌پیوندد. مرتب‌سازی بی قرار به عنوان قسمتی از یک مرتب‌سازی جی استفاده شده‌است.

جستارهای وابسته[ویرایش]

پیوند به بیرون[ویرایش]

منابع[ویرایش]