زنجیره استفاده-تعریف

زنجیره استفاده-تعریف (به انگلیسی: use-definition chain) یک ساختمان داده(به انگلیسی: data structure) است که متشکل از استفاده یک متغیر و همه‌ی تعریف‌هایی از آن متغیر است که می‌تواند به آن استفاده بدون مداخله تعریف دیگری برسد. به طور کلی زنجیره استفاده-تعریف به معنی انتساب چند مقدار به یک متغیر است. همتای زنجیره استفاده-تعریف (به انگلیسی: use-definition chain)، زنجیره‌ی تعریف-استفاده (به انگلیسی: definition-use chain) است که تشکیل شده‌است از یک تعریف یک متغیر و همه‌ی استفاده‌های آن که قابل دسترسی از آن استفاده بدون مداخله تعریف دیگری است. هر دوی زنجیره‌ی استفاده-تعریف و زنجیره‌ی تعریف-استفاده از یک فرم آنالیز ایستای برنامه (به انگلیسی: static code analysis) به نام آنالیز جریان داده (به انگلیسی: data-flow analysis) تشکیل شده‌اند. دانستن زنجیره‌های استفاده-تعریف و تعریف-استفاده برای یک برنامه یا زیربرنامه یک پیش‌نیاز برای چند بهینه‌سازی کامپایلر از جمله درهم کردن ثابت و حذف عبارت‌های مشترک است.

هدف[ویرایش]

درست کردن زنجیره‌ی استفاده-تعریف یا تعریف-استفاده یک گام برای تحلیل متغیر زنده است، که باعث می‌شود نمایش منطقی همه‌ی متغیرها شناخته‌شود و در کد ردیابی شود. تکه کد زیر را در نظر بگیرید:


int x = 0;    /* A */
x = x + y;    /* B */
/* 1, some uses of x */
x = 35;       /* C */
/* 2, some more uses of x */

که همانطور که در کد مشخص است متغیر x سه بار مقداردهی شده‌است.(در نقاط A, B, C) با این که در نقطه‌ای که با "1" مشخص شده‌است زنجیره‌ی استفاده-تعریف برای x باید مشخص کند که مقدار حاضر این متغیر باید از خط B بیاید (و مقدار x در خط B باید از خط A بیاید) اما در نقطه‌ای که با "2" مشخص شده‌است زنجیره‌ی استفاده-تعریف برای x نشان می‌دهد که مقدار حال حاضر این متغیر از C آمده‌است. به دلیل این که مقدار متغیر x در بلاک 2 به هیچ تعریفی از بلاک 1(یا قبل‌تر از آن) بستگی ندارد x ممکن است در آن‌جا متغیری دیگر باشد. در عمل می‌توان گفت یک متغیر دیگر است که ما آن را x2 می‌نامیم.


int x = 0;    /* A */
x = x + y;    /* B */
/* 1, some uses of x */
int x2 = 35;  /* C */
/* 2, some uses of x2 */

فرایند تقسیم x به دو متغیر جدا را تقسیم دامنه‌ی زنده (به انگلیسی: live range splitting) می‌نامند. همچنین فرم تخصیص ایستای منفرد را نیز ببینید.

برپایی[ویرایش]

لیست گزاره‌ها ترتیب مشخصی از گزاره‌ها ارائه می‌دهد.

گزاره‌ها به این شکل برچسب می‌خورند: s(i) که i یک عدد صحیح در بازه ۱ تا n است؛ که n تعداد گزاره‌های موجود در بلوک پایه(به انگلیسی: basic block) است.
متغیرها با حروف انگلیسی ایتالیک نشان داده می‌شوند. مثال: v,u
فرض می‌شود هر متغیر دارای تعریفی در آن محدوده (به انگلیسی: scope or context) است.(در فرم تخصیص ایستای منفرد، زنجیره‌های استفاده-تعریف به دلیل این که هر زنجیره یک عضو دارد، صریح (به انگلیسی: explicit) هستند.)

برای یک متغیر مانند v تعریف اولیه آن با V شناخته می‌شود و برای اختصار تعریف اولیه به شکل s(0) معرفی می‌شود. و البته به طور کلی تعریف اولیه یک متغیر می‌تواند خارج از محدوده انجام شود.(مثال: متغیرهای گلوبال)

تعریف یک متغیر[ویرایش]

وقتی متغیر v در سمت چپ گزاره، مانند s(j) قرار دارد. آن‌گاه s(j) تعریف v خواهد شد. هر متغیر v حداقل یک تعریف از تعریف اولیه V(یا شروع برنامه) دارد.

استفاده یک متغیر[ویرایش]

اگر متغیر v در سمت راست گزاره s(j) باشد. آنگاه یک گزاره s(i) با i<j و min(i-j) وجود دارد که تعریف v است و در s(j) استفاده دارد.(یا به اختصار، وقتی متغیر v در سمت راست گزاره s(j) قرار دارد آنگاه v در گزاره s(j) استفاده دارد.

اجرا[ویرایش]

فرض کنید لیست مرتب گزاره‌های برنامه را s(j) نام گذاری کنیم و اکنون در حال مشاهده گزاره j ام هستیم:

اگر در گزاره s(i) ، i<j یک تعریف وجود داشته باشد در صورتی این تعریف را «زنده» (به انگلیسی: alive) در نظر میگیریم که یک «استفاده» (به انگلیسی: use) از آن تعریف در گزاره s(k) با شرط k>=j وجود داشته باشد. مجموعه تمام تعریف های زنده در گزاره i را با A(i) و تعداد تعریف های زنده نیز با |A(i)| نشان می‌دهیم. (A(i) مفهمومی ساده و قدرتمند است. نتایج نظری و عملی در space complexity theory، access complexity، Register allocation، cache locality exploitation همه بر پایه A(i) به‌دست آمده‌اند.)
اگر تعریفی در گزاره s(i) وجود داشته باشد، این تعریف تمام تعریف‌های قبلی همان متغیر مانند s(k) به شرط k<i را می‌کشد (به انگلیسی: kill).

مثالی از اجرای زنجیره تعریف-استفاده[ویرایش]

این مثال بر پایه کد زیر در زبان جاوا است که وظیفه آن پیدا کردن مقدار بزرگترین مقسوم علیه مشترک دو عدد است. (نیازی به فهمیدن نحوه عملکرد تابع نیست.)


/**

* @param(a, b) The values used to calculate the divisor.
* @return The greatest common divisor of a and b.
*/

int gcd(int a, int b) { 

   int c = a;
   int d = b; 
   if (c == 0)
       return d;
   while (d != 0) { 
       if (c> d)
           c = c - d;
       else
           d = d - c;
   } 
   return c; 

}

برای یافتن تمام زنجیره‌های تعریف-استفاده مربوط به متغیر d، مراحل زیر انجام دهید:

اولین گزاره‌ای که در آن این متغیر تعریف شده و مقدار به آن تخصیص داده شده‌است را جستجو نمایید. در مثال ما خط هفتم "d=b"
اولین گزاره‌ای که در آن از متغیر خوانده‌شده است را جستجو نمایید. در مثال ما خط نهم "return d"
اطلاعات به‌دست آمده را به شکل قالب زیر بنویسید: [گزاره‌ای که در آن خواندن صورت گرفته است، گزاره‌ای که در آن نوشتن صورت گرفته‌است، نام متغیری که در حال ساخت زنجیره تعریف-استفاده آن هستیم] در مثال ما می‌شود: [d, d=b, return d]

این مراحل را به این شکل تکرار کنید: هر گزاره که در آن خواندن صورت گرفته را با هر گزاره‌ای که در آن نوشتن صورت گرفته ترکیب کنید. (با در نظر گرفتن تغییر مقدار متغیر) نتیجه باید به شکل مقابل باشد:


[d, d=b, return d] 
[d, d=b, while(d!=0)] 
[d, d=b, if(c>d)] 
[d, d=b, c=c-d] 
[d, d=b, d=d-c]
[d, d=d-c, while(d!=0)] 
[d, d=d-c, if(c>d)] 
[d, d=d-c, c=c-d] 
[d, d=d-c, d=d-c]

باید در صورت تغییر مقدار متغیر، اقدام‌های لازم را انجام دهید. برای مثال، از خط ۷ الی ۱۳ در برنامه نوشته شده، متغیر d دوباره تعریف نشده و مقدار آن نیز عوض نشده‌است. در خط ۱۴، این متغیر دوباره مقداردهی شده‌است و ممکن است مقدار جدیدی پیدا بکند. به همین دلیل شما باید این گزاره را با همه گزاره‌های خواندن از d که ممکن است پس از این گزاره اجرا شوند ترکیب کنید و به زنجیره اضافه کنید. در مثال ما، فقط خطوط ۱۰ به بعد امکان اجرا پس از خط ۱۴ را دارند و برای مثال خط ۷ هیچگاه دوباره اجرا نخواهد شد. برای فهم بهتر می‌توانید دو متغیر متفاوت به نام‌های d1 , d2 را تصور کنید و زنجیره آن‌ها را به این شکل محاسبه کنید:


[d1, d1=b, return d1] 
[d1, d1=b, while(d1!=0)] 
[d1, d1=b, if(c>d1)] 
[d1, d1=b, c=c-d1] 
[d1, d1=b, d1=d1-c]
[d2, d2=d2-c, while(d2!=0)] 
[d2, d2=d2-c, if(c>d2)] 
[d2, d2=d2-c, c=c-d2] 
[d2, d2=d2-c, d2=d2-c]

در نتیجه می‌توانید چیزی شبیه برنامه زیر داشته باشید. متغیر d1 می‌تواند با متغیر b جابجا شود.


/**

* @param(a, b) The values used to calculate the divisor.
* @return The greatest common divisor of a and b.
**/

int gcd(int a, int b) {

   int c = a;
   int d; 
   if (c == 0)
       return b;
   if (b != 0) {
       if (c> b) {
           c = c - b;
           d = b;
       }
       else
           d = b - c;
       while (d != 0) { 
           if (c> d)
               c = c - d;
           else
               d = d - c;
       }
   } 
   return c; 

}

روش به دست آوردن زنجیره استفاده-تعریف[ویرایش]

تعریف ها را در گزاره s(0) قرار دهید.
برای هر i در بازه ۱ تا n:

a) همه تعریف‌های زنده‌ای که در گزاره s(i) استفاده شده‌اند را پیدا کنید.

b) ارتباطات بین استفاده ها و تعریف ها را ایجاد کنید.

c) گزاره s(i) را به عنوان گزاره تعریف قرار دهید.

d) همه تعاریف قبلی را بکشید.

با این الگوریتم دو چیز به دست می‌آیند:

یک گراف DAG با استفاده‌ها و تعریف‌های متغیر ساخته می‌شود. این گراف نشان دهنده یک وابستگی بین داده‌ها در بین تعریف‌ها و استفاده‌های آنها است و این وابستگی یک ترتیب جزئی ایجاد می‌کند. (از همین رو موازی بودن میان گزاره‌ها را نیز مشخص می‌کند.)
زمانی که به گزاره s(i) رسیده‌ایم، لیستی از مقداردهی‌های زنده متغیرها وجود دارد. برای مثال اگر تنها یک مقداردهی زنده وجود داشته باشد می‌توانیم از روش constant propagation استفاده کنیم.