آپاچی فلوم

از ویکی‌پدیا، دانشنامهٔ آزاد
آپاچی فلوم
انتشار پایدار
۱٫۹٫۰
۸ ژانویه ۲۰۱۹؛ ۵ سال پیش (۲۰۱۹-08}})[۱]
مخزن
نوشته‌شده باجاوا
بن‌سازه رایانشچندسکویی
پروانهمجوز آپاچی
وبگاه

آپاچی فلوم (انگلیسی: Apache Flume) یک نرم‌افزار توزیع‌شده، برای جمع‌آوری و جابجایی کارآمد مقادیر زیادی از داده‌های گزارش است. این معماری ساده و انعطاف‌پذیر بر اساس جریان داده‌های جریان دارد.

آپاچی فلوم به دریافت داده‌های بدون ساختار و نیمه ساخت‌یافته در HDFS کمک می‌کند. می‌توان از این ابزار برای دریافت داده‌های آنلاین از منابع مختلف، مانند ترافیک شبکه، رسانه‌های اجتماعی، پیام‌های ایمیل، فایل‌های رخداد در سیستم و … و ذخیره‌سازی آن بروی HDFS، استفاده کرد.

فلوم از سه جزء تشکیل شده‌است: Source, Sink و Channel.

  • Source: داده‌های ورودی را از یک جریان داده ورودی پذیرش می‌کند و در Channel ذخیره می‌کند.
  • Channel: مانند ذخیره‌سازی محلی یا ذخیره‌سازی اولیه عمل می‌کند. کانال، ذخیره‌سازیِ موقتی بین داده‌های منبع و داده‌های پایدار در HDFS است.
  • Sink: آخرین جزء می‌باشد که داده‌ها را از Channel جمع‌آوری می‌کند و دائماً آن‌ها را در HDFS می‌نویسد.

جستارهای وابسته[ویرایش]

منابع[ویرایش]