کلاودارا ایمپالا

از ویکی‌پدیا، دانشنامهٔ آزاد
کلاودارا ایمپالا
انتشار پایدار
۱.۲.۴
مخزن
سیستم‌عاملچندسکویی
وبگاه

کلاودارا امپایلا نرم‌افزار متن بازی است که شرکت کلاودارا برای پردازش موازی سنگین ارائه نموده‌است. این محصول یک موتور SQL برای ذخیره‌سازی داده‌های در کلاستر رایانه‌ایی مبتنی بر هادوپ است.[۱]

توصیف[ویرایش]

کلاوداِرا ایمپالا موتور «پرسش» (به انگلیسی: Query) است که بر روی هادوپ اجرا می‌شود. پرژه در اکتبر ۲۰۱۲ به صورت عمومی معرفی و توزیع شد. این توزیع به شکل «نسخهٔ آزمایشی بتا» صورت گرفت.[۲][۳] امپالا، پروژه‌ایی تحت اجازه‌نامه آپاچی است. ایپالا که فناوری پایگاه دادهٔ مقیاس وسیع را به هادوپ آورده و کاربران را قادر به ارائه پرسش و دریافت پاسخ در کمترین زمان ممکن می‌نماید. این پرسش، در قالبِ اس‌کیوال و بر روی داده‌های مستقر شده در اچ‌دی‌افٰ‌اس (سیستم‌فایل توزیعی هادوپ) و اچ‌بیس (پایگاه دادهٔ توزیعی هادوپ) صورت می‌گیرد. در هنگام پرسش، داده‌های بر روی ادی‌اف‌اس جابجا یا منتقل نمی‌شوند. امپالا با هادوپ تجمیع شده تا از فایل‌ها، اَبَرداده‌ا، حفاظت و مدیریت منابع به صورت مشترک بهره برد. در قالب این اشتراک، امپایلا امکان کار با چارچوب‌های «نگاشت‌کاهش»، «آپاچی هایو»، «آپاچی پیگ» را فراهم می‌کند

امپالا برای تحلیل‌گران داده و پژوهشگران علمی که بر روی داده‌های ذخیره‌شده بر روی هادوپ کار می‌کنند مناسب اعلام شده‌است. این داده‌ها را می‌توان از طریق SQL یا ابزارهای تجازی هوشمند مورد استفاده قرار داد. نتایج حاصله خوراک اولیه را برای پردازش در حجم وسیع را که برای نگاشت‌کاهش فراهم می‌کند. همچنین می‌توان به پرسش‌های تعاملی در همان سیستم دست‌یافت. بدین ترتیب داده‌های و ابر داده‌ها بدون نیاز به مهاجرت داده‌ها به سیستم‌های دیگر را فراهم می‌کند.

امپایلا شامل ویژگهای:

  • پشتیبانی از ذخیره‌سازی اچ‌دی‌اف‌اس
  • پشتیبانی از خواندن داده‌ها تحت قالب هادوپ، شاملِ متن، LZO و فایل‌های دنباله‌دار (به انگلیسی: SequenceFile)، Avro، RCFile
  • پشتیبانی از حفاظت هادوپ (تعین هویت با Kerberos)
  • دانه‌بندی زیر، احراز هویت مبتنی بر نقش ((به انگلیسی: role-based authorization))[۴]
  • استفاده از اَبَرداده‌ها، رانشگرِ ODBC، عبارت SQL از آپاچی هایو

در اوایل ۲۰۱۳، پایگاه‌داده‌ایی مبتنی بر ستون به نام Parquet که ارائه شد که می‌توان در امپالا از آن استفاده نمود.[۵] در دسامبر ۲۰۱۳ آمازون وب سرویس (AWS) اعلام کرد که از امپالا پشتیبانی می‌نماید.[۶]

منابع[ویرایش]

  1. "Cloudera Impala". Retrieved 14 March 2014.[پیوند مرده]
  2. Larry Digna (October 24, 2012). "Cloudera aims to bring real-time queries to Hadoop, big data". Between the lines blog. ZDNet. Retrieved January 20, 2014.
  3. Andrew Brust (October 25, 2012). "Cloudera's Impala brings Hadoop to SQL and BI". ZDNet. Retrieved January 20, 2014.
  4. «Sentry». بایگانی‌شده از اصلی در ۵ نوامبر ۲۰۱۳. دریافت‌شده در ۴ آوریل ۲۰۱۴.
  5. "Parquet: Columnar Storage for Hadoop". Project web site. 2013. Retrieved January 20, 2014.
  6. "Announcing Support for Impala with Amazon Elastic MapReduce". Amazon.com. December 12, 2013. Retrieved January 20, 2014.

پیوند[ویرایش]