پاک‌سازی داده

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به ناوبری پرش به جستجو

پاک‌سازی داده‌ها یا تمیز کردن داده‌ها فرایند پیدا کردن، اصلاح کردن (یا حتی حذف کردن) داده‌های بی ارزش و اشتباه از مجموعه داده (دیتاست) یا پایگاه داده (دیتابیس) است. فرایند تمیز کردن داده‌ها ممکن است که از طریق ابزارهای داده‌کاوی یا پردازش دسته‌ای از طریق اسکریپت‌ها انجام شود. بعد از پاکسازی، مجموعه داده باید با سایر مجموعه داده‌های مشابه در سیستم سازگار باشد. ناسازگاری داده‌ها شناسایی و حذف (اصلاح) شده ممکن است بر اثر اشتباه انسانی هنگام ورود اطلاعات، انحراف در هنگام انتقال و ذخیره سازی اطلاعات یا به دلیل واژه نامه‌های داده مختلف باشد.

منابع[ویرایش]