نایم

از ویکی‌پدیا، دانشنامهٔ آزاد
KNIME
توسعه‌دهنده(ها)KNIME
انتشار پایدار
4.5.0
December 6, 2021[۱]
مخزن
سیستم‌عاملLinux, OS X, Windows
در دسترس بهEnglish
گونهGuided Analytics / Enterprise reporting / Business Intelligence / Data Mining/ Deep Learning / Data Analysis / Text mining / Big Data
پروانهGNU General Public License
وبگاه

نایم ،KNIME (‎/nm/‎) ، مخفف استخراج کننده اطلاعات کنستانز Konstanz Information Miner[۲] یک پلتفرم تجزیه و تحلیل داده، گزارش و یکپارچه سازی رایگان و منبع باز است. نایم کامپاننتهای مختلفی را برای یادگیری ماشین و داده کاوی از طریق خط لوله داده‌های مدولار خود، که آن را «ساخت بلوک‌های تجزیه و تحلیل» می‌نامد، تجمیع می‌کند. یک رابط کاربری گرافیکی و استفاده از JDBC امکان اسمبل کردن گره‌ها را با ترکیب منابع داده مختلف، از جمله پیش پردازش (ETL: استخراج ، تبدیل و بارگذاری)، برای مدل‌سازی، تجزیه و تحلیل داده‌ها و تجسم (نمایش) بصورت بدون برنامه‌نویسی یا با حداقل برنامه‌نویسی فراهم می‌کند.

از سال ۲۰۰۶، نایم در تحقیقات دارویی استفاده شده‌است،[۳] همچنین در زمینه‌های دیگری مانند تجزیه و تحلیل داده‌های مشتری CRM ، هوش تجاری، متن کاوی و تجزیه و تحلیل داده‌های مالی استفاده می‌شود. اخیراً تلاش‌هایی برای استفاده از نایم به عنوان ابزار اتوماسیون فرایند روباتیک (RPA) صورت گرفته‌است.[۴]

دفتر مرکزی نایم در زوریخ مستقر است و دفاتر دیگری در کنستانز، برلین و آستین (ایالات متحده آمریکا) دارد.

تاریخچه[ویرایش]

توسعه نایم در ژانویه ۲۰۰۴ توسط تیمی از مهندسان نرم‌افزار در دانشگاه کنستانز به عنوان یک محصول اختصاصی آغاز شد. تیم توسعه‌دهنده اصلی به سرپرستی مایکل برتولد از شرکتی در سیلیکون ولی می‌آمد که نرم‌افزاری برای صنعت داروسازی ارائه می‌کرد. هدف اولیه، ایجاد یک پلتفرم پردازش داده ماژولار، بسیار مقیاس پذیر و باز بود که امکان ادغام آسان ماژول‌های بارگذاری، پردازش، تبدیل، تجزیه و تحلیل و اکتشاف بصری داده‌های مختلف را بدون تمرکز بر هیچ حوزه کاربردی خاصی فراهم می‌کرد. این پلتفرم به عنوان یک پلتفرم همکاری و تحقیق در نظر گرفته شده بود و همچنین باید به عنوان یک پلتفرم یکپارچه برای پروژه‌های مختلف تجزیه و تحلیل داده‌های دیگر عمل کند.[۵]

در سال ۲۰۰۶ اولین نسخه نایم منتشر شد و چندین شرکت داروسازی شروع به استفاده از نایم کردند و تعدادی از فروشندگان نرم‌افزار علوم زیستی شروع به ادغام ابزارهای خود در نایم کردند.[۶][۷][۸][۹][۱۰] بعداً در همان سال، پس از مقاله ای در مجله آلمانی c't ,[۱۱] کاربرانی از تعدادی از مناطق دیگر[۱۲][۱۳] به گروه استفاده‌کنندگان پیوستند. از سال ۲۰۱۲، نایم توسط بیش از ۱۵۰۰۰ کاربر واقعی (در این شمارش دانلودها محاسبه نمی‌شود، تنها کاربرانی که به‌طور مرتب به روز رسانی‌ها را زمانی که در دسترس قرار می‌گیرند بازیابی می‌کنند، شمرده می‌شوند) نه تنها در علوم زیستی، بلکه همچنین در بانک‌ها، ناشران، سازندگان خودرو، مخابرات، شرکت‌های مشاوره، و صنایع مختلف دیگر و همچنین در تعداد زیادی از گروه‌های تحقیقاتی در سراسر جهان استفاده می‌شود. آخرین به‌روزرسانی‌های نایم سرور و افزونه‌های کلان داده نایم، از آپاچی اسپارک ۲٫۳، پارکت و فضای ذخیره‌سازی HDFS پشتیبانی می‌کند.

برای ششمین سال متوالی، نایم به عنوان پیشرو برای پلتفرم‌های علم داده و یادگیری ماشین در ربع جادویی گارتنر قرار گرفته‌است.

یک اسکرین شات از نایم

داخلی[ویرایش]

نایم به کاربران اجازه می‌دهد تا به صورت بصری جریان‌های داده (یا خطوط لوله) ایجاد کنند، برخی یا تمام مراحل تجزیه و تحلیل را به صورت انتخابی اجرا کنند و بعداً نتایج و مدل‌ها را با استفاده از ویجت‌ها و نماهای تعاملی بررسی کنند. نایم به زبان جاوا و بر اساس اکلیپس نوشته شده‌است. از مکانیزم افزونه برای افزودن پلاگین‌هایی استفاده می‌کند که عملکردهای اضافی را ارائه می‌دهند. نسخه اصلی به‌طور پیش فرض شامل صدها ماژول برای یکپارچه سازی داده‌ها است (ورودی/خروجی فایل، گره‌های پایگاه داده که از تمام سیستم‌های مدیریت پایگاه داده رایج از طریق JDBC یا اتصال دهنده‌های بومی پشتیبانی می‌کنند: اس کیوالایت، ام اس اکسس، اس کیو ال سرور، مای اسکیو ال، اوراکل، پستگرس کیو ال، ورتیکاو اچ ۲)، تبدیل داده‌ها (فیلتر، تبدیل کننده، تقسیم‌کننده، ترکیب کننده، متصل کننده) و همچنین روش‌های رایج آمار، داده کاوی، تجزیه و تحلیل و تجزیه و تحلیل متن. نمایش با افزونه رایگان طراح گزارش (Report Designer) پشتیبانی می‌شود. گردش کار نایم را می‌توان به عنوان مجموعه داده برای ایجاد الگوهای گزارش استفاده کرد که می‌توانند به فرمت‌های سند مانند doc, ppt, xls, pdf و موارد دیگر صادر شوند. سایر قابلیت‌های نایم عبارتند از:

  • معماری هسته نایم امکان پردازش حجم داده‌های بزرگی را فراهم می‌کند که تنها با فضای موجود در هارد دیسک محدود می‌شوند (نه محدود به حافظه رم موجود). به عنوان مثال نایم امکان تجزیه و تحلیل ۳۰۰ میلیون آدرس مشتری، ۲۰ میلیون تصویر سلولی و ۱۰ میلیون ساختار مولکولی را فراهم می‌کند.
  • افزونه‌های اضافی امکان ادغام روش‌های متن کاوی، تصویر کاوی، و همچنین تجزیه و تحلیل سری‌های زمانی و شبکه را فراهم می‌کنند.
  • نایم سایر پروژه‌های منبع باز مختلف را ادغام می‌کند، به عنوان مثال الگوریتم‌های یادگیری ماشین از وکا، H2O.ai، کرس، اسپارک، پروژه R و LIBSVM. و همچنین به صورت پلاتلی، جی فری چت، ایمج جی، و کیت توسعه شیمی.[۱۴]

نایم توسط جاوا پیاده‌سازی می‌شود، با این وجود به رپرها اجازه می‌دهد تا کدهای دیگر را فراخوانی کنند، به علاوه گره‌هایی ارائه می‌دهد که اجازه اجرای جاوا، پایتون، R، روبی و سایر قطعات کد را می‌دهند.

مجوز[ویرایش]

از نسخه نایم ۲٫۱ تحت GPLv3 منتشر شد، با یک استثنا که به دیگران اجازه می‌دهد از API گره به خوبی تعریف شده برای افزودن افزونه‌های اختصاصی استفاده کنند.[۱۵] این به فروشندگان تجاری SW نیز اجازه می‌دهد تا بسته‌هایی را اضافه کنند که ابزارهای خود را از نایم فراخوانی می‌کنند.

دوره‌های آموزشی نایم[ویرایش]

نایم دو خط دوره آنلاین بر اساس خطوط Data Wrangling و Data Science ارائه می‌دهد.[۱۶]

جستارهای وابسته[ویرایش]

  • وکا – الگوریتم‌های یادگیری ماشینی که می‌توانند در نایم ادغام شوند
  • الکی- چارچوب داده کاوی با بسیاری از الگوریتم‌های خوشه بندی
  • کرس - کتابخانه شبکه عصبی
  • اورنج - یک مجموعه ابزار نمایش داده منبع باز، یادگیری ماشین و داده کاوی با رابط برنامه‌نویسی بصری یکسان.
  • لیست بسته‌های نرم‌افزاری رایگان و متن باز

منابع[ویرایش]

  1. "What's New in KNIME Analytics Platform 4.0 and KNIME Server 4.9". knime.com.
  2. Berthold, Michael R.; Cebron, Nicolas; Dill, Fabian; Gabriel, Thomas R.; Kötter, Tobias; Meinl, Thorsten; Ohl, Peter; Thiel, Kilian; Wiswedel, Bernd (16 November 2009). "KNIME - the Konstanz information miner" (PDF). ACM SIGKDD Explorations Newsletter. 11 (1): 26. doi:10.1145/1656274.1656280.
  3. Tiwari, Abhishek; Sekhar, Arvind K.T. (October 2007). "Workflow based framework for life science informatics". Computational Biology and Chemistry. 31 (5–6): 305–319. doi:10.1016/j.compbiolchem.2007.08.009. PMID 17931570.
  4. "KNIME Analytics Platform Bot".,
  5. "Open for Innovation". KNIME.com.
  6. Tripos, Inc.
  7. Schrödinger بایگانی‌شده در ۲۰۰۹-۰۹-۲۵ توسط Wayback Machine
  8. ChemAxon بایگانی‌شده در ۲۰۱۱-۰۷-۱۷ توسط Wayback Machine
  9. NovaMechanics Ltd.
  10. Treweren Consultants
  11. Datenbank-Mosaik Data Mining oder die Kunst, sich aus Millionen Datensätzen ein Bild zu machen, c't 20/2006, S. 164ff, Heise Verlag.
  12. Forum auf der KNIME Webseite
  13. "Pervasive". Archived from the original on 2010-08-29. Retrieved 2010-12-07.
  14. Beisken, S.; Meinl, T.; Wiswedel, B.; De Figueiredo, L. F.; Berthold, M.; Steinbeck, C. (2013). "KNIME-CDK: Workflow-driven Cheminformatics". BMC Bioinformatics. 14: 257. doi:10.1186/1471-2105-14-257. PMC 3765822. PMID 24103053.
  15. KNIME 2.1.0 released بایگانی‌شده در ۲۰۱۰-۰۴-۱۷ توسط Wayback Machine
  16. the new learning path[پیوند مرده]

پیوند به بیرون[ویرایش]