پرش به محتوا

برکلی ریسک

از ویکی‌پدیا، دانشنامهٔ آزاد

یکی از دو پروژه‌های تحقیقاتی اصلی در باب طراحی میکرو پروسسورهای بر پایه معماری ریسک است که تحت پروژه VLSI از ARPA جایگاه دارد. ریسک تحت مدیریت David Patterson (کسی که واژه ریسک را اختراع کرد) در دانشگاه کالیفرنیا، برکلی بین سال‌های ۱۹۸۰ و ۱۹۸۴ انجام گرفت. پروژه بعدی که بر روی MIPS اندکی بعد انجام گرفت؛ در دانشگاه استنفورد و در طی سال‌های ۱۹۸۱ و ۱۹۸۴ بود. پروپزه برکلی بسیار موفقیت‌آمیز بود به‌طوری‌که به عنوان نامی برای تمامی طراحی‌های بعدی شد، به‌طوری‌که حتی MIPS هم به عنوان “RISK processor” شهرت یافت. طراحی RISC اندکی بعد نام تجاری پروسسور SPARC را به خود گرفت و معماری DEC Alpha را همچون معماری ARM که امروزه در اکثر موبایل‌ها مورد استفاده‌اند را مورد الهام خود قرار داد.

هر دو مورد ریسک و میپس بر این واقعیت استوار بودند که تعداد زیادی از زبان‌ها از تعداد زیادی از دستورها پروسسور استفاده نمی‌کنند. در محاسباتی که انجام شده‌است یه این موضوع رسیده‌ایم که سیستم یونیکس به هنگام کامپایل شدن تنها ۳۰ درصد از دستورها در دسترس در Motorola ۶۸۰۰۰ را استفاده می‌کند. بسیاری از مدارات و جریانات در داخل m68k و طراحی‌های مشابه، اختصاص به دیکد کردن دستورهایی می‌شد که هیچگاه مورد استفاده نبودند. ایدهٔ RISC این بود که تنها دستورهایی را شامل شود که واقعاً استفاده می‌شوند. استفاده از فضای مدارات پاک شده برای مدارات جدید که سرعت را افزایش دهد. بر این پایه معماری RISC تمرکزش را بر اضافه کردن تعداد بیشتر ثبات‌ها گذاشت. بیت‌های کوچک حافظه برای نگه داشتن مقادیر موقت که با صرف هزینه کم در دسترس قرار می‌گیرد. این مخالف با حافظه نرمال اصلی می‌باشد که زمان زیادی را صرف دسترسی می‌کرد. با فراهم کردن تعداد بیشتر از ثبات‌ها و اطمینان به این که کامپایلر واقعاً از آن‌ها استفاده می‌کند، برنامه‌ها باید با سرعت بیشتری اجرا شوند. به علاوه سرعت پردازنده با Clock سرعت آن معرفی می‌شود. زیرا میزان کمی از زمان آن برای منتظر ماندن برای دسترسی به حافظه صرف می‌شود. در واقع، دستورهایی که پاک شدند، دستورها اضافه‌ای بودند که نقش دستورها زیر برنامه‌ای داشتند. برای مثال در روش‌های قدیمی، چندین روش برای دستور ADD وجود داشت، یکی این بود که اعداد را در دو ثبات قرار دهد و نهایتاً جواب را در ثبات سوم جای دهد. روش دیگر این بود که اعدادی را که در حافظه پیدا می‌کرد را با یکدیگر جمع می‌کرد و جواب را در یک ثبات نهایی قرار می‌داد و غیره. از طرف دیگر معماری RISC تنها یک روش برای هر دستور را شامل کرد، برای مثال دستور ADD همیشه برای هر عملوند یک ثبات استفاده می‌کرد. این روند باعث می‌شود که برنامه‌نویس را مجبور کند تا دستورها اضافه‌ای برای load کردن مقادیر از حافظه بنویسد. در دوره حافظه‌های گران، این تنها علاقه و هدف بود، به ویژه این که حافظه بسیار کندتر از CPU بود. به دلیل آنکه در طراحی ADD در معماری ریسک به چهار دستور (دو دستور Load، یک add و یک ذخیره) نیاز بود، ماشین بایستی به حافظه بیشتر دسترسی پیدا می‌کرد تا دستورها اضافی را بخواند و این باعث کند شدن قابل توجه آن می‌شد. این در واقع یک تعادل بود، که طراحی جدید آن را استفاده کرد، که در واقع دستورها بزرگی (۳۲ بیت) بودکه اجازه می‌داد ثابت‌های کوچک بدون load شدن جداگانه در دستور قرار بگیرند. به علاوه استفاده نتیجه یک عمل زودتر از انجام گرفتن جای دیگر استفاده می‌شد، در نهایت با چشم پوشی از نوشتن در حافظه و ذخیره آن در یک ثبات، برنامه بزرگ نمی‌شد و در این تئوری می‌توانست سریع تر اجرا شود. برای مثال دستورهایی که یک عمل ریاضی را انجام می‌داد می‌توانست با تعداد کمی بار شدن از حافظه انجام گیرد در حالی که تعداد زیادی از اعدادی که استفاده می‌شد به صورت ثابت در یک دستور بودند یا به صورت یک عملگر میانی در بین ثبات. در این حالت، در این تکنولوژی برخی از ثبات‌ها به عنوان «سایه» مکان حافظه استفاده می‌شدند بنابراین ثبات‌ها نقش مکان‌های حافظه را بازی مس کردند تا مقدار نهایی آن‌ها بعد از تعداد زیادی از دستورها محقق شود. برای ناظران غیر جدی، این موضوع روشن نبود که مفهوم ریسک اجرا را بهبود می‌بخشد و ممکن است که آن را بدتر بکند. تنها راه مطمئن شدن شبیه‌سازی آن بود. بنابر این، این موضوع انجام گرفت و نتیجه مشخص بود. در آزمایش‌های متوالی، هر شبیه‌سازی مفید بودن این طرح را نشان داد. جایی که تفاوت دو پروژه RISC و MIPS در مدیریت ثبات‌ها بود.MIPS به سادگی بسیاری از آن هارا اضافه کرد و آن‌ها را به کامپایل (یا برنامه نویسان زبان اسمبلی) داد که از آن استفاده کند. از طرفیRISC مداراتی را به CPU اضافه کرد تا به کامپایلر کمک کند. ریسک از مفهوم پنجره‌های ثبات استفاده کرد که در آن تمام فایل‌های رجیستر به بلوک‌هایی شکسته می‌شوند و اجازه می‌دهد تا کامپایلر یک بلوک را به عنوان متغیرهای جهانی و یک بلوک را به عنوان متغیر محلی ببیند. ایده این بود که یک دستور معمول ویژه بسازیم، procedure call، تا پیاده‌سازی ان در کامپایلر بسیار ساده و آسان باشد. تقریباً تمام زبان‌های کامپیوتر از یک سیستم به نام Activation record یا Stack frame برای هر پروسیجر که شامل آدرسی که پروسیجر خوانده شده‌است، پارامترهای گذر داده شده و فضایی که برای برگرداندن نتیجه تابع استفاده می‌کنند. اکثر اوقات این فریم‌ها بسیار کوچک هستند و معمولاً با ۳ یا کمتر ورودی و یک یا هیچ خروجی که گاهی اوقات یک ورودی به عنوان خروجی دوباره استفاده می‌شود. در طراحی برکلی یک ثبات پنجره‌ای مجموعه‌ای از ثبات‌ها بود، تعداد کافی از آن‌ها که Stach frame می‌توانست کاملاً در داخل ثبات‌های پنجره‌ای قرار گیرد. در این مورد فراخواندن و خواند از یک پروسیجر بسیار ساده و بسیار سریع است. یک دستور منفرد خوانده می‌شود تا بلوک‌های جدید از ثبات را بسازد (یک پنجره ثبات جدید) و بعد با گذراندن عملوندها به پروسیجر در قسمت “low end” از پنجره جدید، برنامه به سمت پروسیجر پرش می‌کند. در بازگشت، نتایج در پنجره در انتهای مشابه جای گزین می‌شوند و پروسیجر می‌ماند. پنجره‌های ثبات ساخته می‌شوند تا در دو انتها overlap شوند. بنابراین نتیجه فراخوانی در پنجره فراخواننده مشاهده می‌شود. بدون هیچ کپی داده‌ای. بنابراین فراخوانی پروسیجرهای معمول نباید با حافظه اصلی متقابلاً اثر داشته باشد و بسیار خوب آن را سرعت می‌دهد. قسمت تاریک این روش این است که پروسیجرهای با متغیرهای محلی بزرگ مشکل آفرینند و با متغیرهای کوچکتر باعث می‌شود که ثبات‌ها (یک منبع گران‌قیمت) ضایع شود. تعداد محدودی از پنجره‌های ثبات در این طراحی، مثلاً ۸ عدد، وجود دارد. بنابراین پروسیجرها تنها می‌توانند این تعداد مرحله را بسازند تا پیش از اینکه مکانیزم ثبات پنجره‌ای به حد خود برسد. وقتی که یک پنجره به حد خود رسید هیچ پنجره جدیدی نمی‌تواند ساخته شود و اگر پروسیجرها تنها مقداری پیش روی کرده باشند؛ ثبات‌های بالای عمیق‌ترین فراخوانی قابل دسترس نمی‌باشند و بنابراین همه آن‌ها به هدر می‌روند. این کار استنفورد بود به این موضوع عقیده داشت که یک کامپایلر کارآمد می‌تواند استفاده بهتر از ثبات‌ها ببرد تا یک سیستم سخت‌افزاری ثابت. (دلیل مشابهی برای برنامه‌نویسی هوشمند زبان اسمبلی به کار می‌رود)

اولین هدف برای پیاده‌سازی مفهوم ریسک به "طلاً شهرت دارد. کار بر روی طرح از سال ۱۹۸۰ آغاز شد. کار بر روی طرح در سال ۱۹۸۰ به عنوان بخشی از طراحی VLSI انجام گرفت، اما طراحی پیچیده بعدی همه طراحی‌های موجود را خراب کرد. تیم موجود باید ساعت‌ها وقت صرف می‌کردند تا ابزار را دوباره بنویسند یا بهتر کنند و حتی با این ابزار تنها کمتر از یک ساعت زمان صرف می‌شد تا طرح از VAX-۱۱/۷۸۰ خارج شود. طراحی نهایی که به ریسک ۱ مشهور است در ACM ISCA در سال ۱۹۸۱ منتشر شد. شامل ۴۴٬۵۰۰ ترانزیستور بود که ۳۱ دستور را پیاده‌سازی می‌کرد و یک فایل ثبات‌ها که شامل ۷۸ ثبات ۳۲ بیتی بود. این برای ۶ ثبات پنجره که هر یک شامل ۱۴ ثبات با ۱۸ جهانی اضافه بود. کنترل و دستورها دیکد تنها ۶٪ هسته را شامل می‌شد در حالی که نوعی از طراحی تنها ۵۰٪ برای نقشه مشابه را استفاده می‌کرد. فایل ثبات بیشتر فضا را در بر می‌گرفت. همچنین ریسک ۱ از دستور پایپ لاین دو بخشی برای سرعت بالاتر استفاده کرد اما بدون دستورها پیچیده برای مرتب‌سازی طراحی مدرن تر. این باعث ایجاد یک مشکل در شاخه‌های شرطی شد، زیرا کامپایلر باید دستور را با توجه به شاخه شرطی پر کندبه اصطلاح "branch delay slot"با چیزی که که انتخاب شده تا “safe” باشد (برای مثال به نتیجه شرطی وابسته نباشد) بعضی اوقات تنها دستور مناسب برای این زمان NOPاست. تعداد قابل توجهی از طراحی RISC-styleهنوز نیاز به توجه به تأخیر شاخه دارد. بعد از یک ماه تأیید و تصحیح سرانجام طرح به سیستم نوآوری MOSIS برای تولید در۲۲ ژوئن سال ۱۹۸۱ فرستاده شد و از پروسه (۲۰۰۰ nm) استفاده شد. تاخیرهای متنوع باعث شد تا ماسک هایشان را ترک کنند. اولین کامپیوتر ریسک ۱ کارشده در ۱۱ ژوئن راه افتاد. در تست ثابت شد که چیپ‌ها اجرایی پایین‌تر از اجرای مورد انتظار دارند. در کل، یک دستورالعمل در واقع ۲μs طول می‌کشد تا کامل شود در حالی که طرح اصلی ۴μs تخصیص داده می‌شود(۵ بار سریع تر). دلیل دقیق برای این مشکل هرگز به تور دقیق توضیح داده نشد. اما در طی تست این موضوع مشخص بود که برخی دستورها در سرعت مورد نظر اجرا نمی‌شدند. پیشنهادهایی برای این مشکل فیزیکی بود و نه منطقی. باید طرح در سرعت بالایی اجرا می‌شد تا خوب به نظر می‌آمد. شبیه‌سازی برنامه‌های کوچکی را برای مقایسه ۴MHz RISC۱ با 5 MHz 32-bit VAX ۱۱/۷۸۰ استفاده می‌کرد و 5 MHz 16-bit Zilog Z۸۰۰۰این را به صورت واضح نشان می‌داد. سایز برنامه۳۰٪ بیشتر از VAX بود اما بسیار نزدیک به آن از ۸۰۰۰Z. به صورت کلی اجرای کلی RISC۱ دو برابر سریع تر از VAX بود و ۴ برابر Z8000. بسیار جالب، این که برنامه‌ها به صورت کلی میزان یکسانی از حافظه را استفاده می‌کردندزیرا فایل ثبات‌ها به صورت قابل تأملی احتمال وجود عملوندمورد نیازرا افزایش دادند. این مهم است که به این اجرا ارج نهیم اگرچه طراحی RISC کندتر از VAX بود هیچ خللی بر اهمیت آن وارد نمی‌کرد. ریسک اجازه تولید یک پروسسور حقیقی ۳۲ بیتی را بر روی یک هسته واقعی می‌داد و استفاده از چیزی که از قبل یک فاب قدیمی تر بود. طراحی سنتی به سادگی با تعداد زیادی چیپ که به منطق دیکدر اختصاص داده می‌شوند نمی‌تواند این کار را انجام دهد. یک طراحی ۳۲ بیتی مانند Motorola ۶۸۰۲۰ نیاز به فاب‌های جدیدی داشت قبل از اینکه مورد استفاده قرار گیرد. با استفاده از همان فاب، RISC۱ می‌توانست کارایی بهتری داشته باشد.

هنگامی که طراحی ریسک ۱ به تأخیر افتاد، کار در برکلی به طراحی آبی تغییر یافت. کار بر روی آبی پروسهٔ کندتری داشت. این سرعت باعث شد که ویژگی‌های جدیدی به طرح اضافه شود. کلید تفاوت کش ساده‌تری بود که یک خط در هر بیت را حذف می‌کردو به صورت قابل توجهی سایز فایل ثبات را افزایش داد. با توجه به طراحی جدید ذخیره کردن افزایش یافت. ساختار «طلایی» شامل ۷۸ ثبات در ۶ پنجره بود و آبی شامل ۱۳۸ ثبات در ۸ پنجره بود که هر یک ۱۶ ثبات داشت با ۱۰ جهانی. این گسترش باعث شد که هر پروسیجر شانس این را داشته باشد تا تمام متغیرهای محلی خود را ذخیره کند. با این وجود فایل‌های بزرگ‌تر ثبات نیاز به ترانزیستورهای کمتری داشتند و در آخر طراحی آبی، به عنوان ریسک ۲ پیاده‌سازی شد. همه دستورها با تنها ۳۹۰۰۰ ترانزیستور ست شدند.

منابع

[ویرایش]