پرونده (رایانه)

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

در فرهنگ رایانه، پرونده یا فایل (به انگلیسی: File) به کوچک‌ترین واحد منطقی ذخیره‌سازی بر روی دیسک گفته می‌شود که کاربر یا برنامه‌ساز، قادر به مشاهده و دستکاری آن است. در یک تعریف کلی، فایل مجموعه‌ای است دارای یک نام (و معمولاً دارای یک ساختار درونی مشخص) از نمونه‌های مختلف یک یا چند نوع رکورد. البته ممکن است فایل اصلاً مجموعه‌ای از رکوردها نباشد، بلکه صرفاً دنباله‌ای بی‌ساختار از نویسه‌ها باشد که از نظر سیستم فایل، معنای خاصی هم ندارند.[۱]

انواع فایل های کامپیوتری به اهداف گوناگون ساخته می شوند. فایل می تواند برای ذخیره سازی عکس ها، نوشته ها، فیلم ها، برنامه های کامپیوتری یا طیف گسترده ای از دیگر داده ها استفاده شود.

تاریخچه[ویرایش]

کلمه ی فایل از کلمه ی لاتین filum گرفته شده است. [۲]

محتویات پرونده ها[ویرایش]

در بیشتر سیستم عامل های جدید، پرونده ها در آرایه هایی از بایت ها ذخیره می شوند. به عبارتی دیگر، بیت ها بایت ها را می سازند، بایت ها در کنار یک دیگر به رشته(به انگلیسی: string) معنا می دهند. به رشته ی معنادار، فیلد می گویند. مجموعه ی فیلدها، رکورد، و مجموعه ی رکوردها، فایل یا پرونده را می سازد. به مجموعه ای از پرونده ها یک پایگاه داده گفته می شود.

محتویات پرونده نمایانگر نوع آن است که معمولا با پسوند نام پرونده نشان داده می شود؛ این پسوند نحوه ی سازماندهی بایت ها را مشخص می کند تا به درستی خوانده شوند. برای مثال، بایت های یک متن نوشتاری ساده(که در سیستم عامل ویندوز با پسوند txt. نشان داده می شود) به وسیله یوتی‌اف-۸ یا کد اسکی شناخته می شوند. اکثر گونه های پرونده، تعداد کمی بایت را به ذخیره سازی فراداده(به انگلیسی: metadata) اختصاص می دهند که به فایل این امکان را می دهد که اندک اطلاعاتی را درباره ی خود ذخیره کند.

گونه‌های پرونده[ویرایش]

به طور کلی پرونده ها به دو گروه پرونده های باینری(به انگلیسی: binary) و پرونده های متنی(به انگلیسی: text) تقسیم می شوند.

اما به ازای انواع داده ها تعداد زیادی نوع فایل وجود دارد:

TXT, CSV, HTML, HTM, JS, CSS, C, CPP, PHP, BAS, ASM, LOG, INF از انواع گونه های پرونده های متنی هستند.
فایل های صوتی دارای گونه های مختلفی از جمله WAV, MP3, WMA, OGG, ACC و... هستند.
فایل های تصویری دارای دو نوع شطرنجی (به انگلیسی: Raster graphics) و برداری (به انگلیسی: Vector graphics) هستند.فرمت های JPG, BMP در دسته ی اول و WMF, SVG, EMF در دسته ی دوم قرار می گیرند.
پسوند exe كه از عبارت Executable و به معنای اجرايی گرفته شده، نشان دهنده اين است كه پرونده موردنظر حاوی كدهای اجرايی بوده و يك برنامه كامپيوتری است. اين نوع فايل ها ساختمان پيچيده های دارند كه در حيطه كار برنامه نويسی است.
MPEG, MPG, AVI, WMV, 3GP, ASF, DAT, DIVX, FLV, OGV, QT از انواع پرونده های ویدئویی هستند.

و ...

فایل دارای پسوند معمولاً 3 کاراکتری می باشد.


سازمان دهی پرونده ها[ویرایش]

در یک پایگاه داده تعداد زیادی داده وجود دارد. داده های مرتبط در جدول ها ذخیره می شوند. هر جدول شامل چندین رکورد است. این رکورد ها به عنوان فایل در حافظه ذخیره شده اند. معمولا یک فایل شامل تمامی رکوردهای یک جدول می شود.(داده ها در حافظه ی فیزیکی به شکل رکورد ذخیره شده و برای کاربر در قالب فایل نمایش داده می شوند).

همان طور که معلوم است دسترسی به محتوای فایل ها(که در حافظه ی فیزیکی به عنوان رکورد ذخیره شده اند)، خیلی آسان نیست. پس به روش هایی برای دستیابی به آن ها نیاز داریم. برای این کار باید آن ها را با یک روش معین مرتب کنیم؛ همان طور که در کتاب برای یافتن آسان تر مطالب از فهرست آن استفاده می کنیم.

هر پوشه می تواند شامل چند پرونده یا پوشه ی دیگر باشد

مرتب کردن پرونده ها با یک روش معین سازماندهی پرونده ها نامیده می شود.

اهداف اصلی این سازماندهی عبارتند از:

  • دسترسی هر چه سریع تر به اطلاعات
  • آسان تر و سریع تر کردن عملیات اضافه کردن، حذف یا بروز کردن اطلاعات
  • ذخیره ی بهینه ی رکوردها؛ در نتیجه کمینه کردن هزینه ی ذخیره سازی


روش رایج مرتب سازی پرونده ها، استفاده از یک ساختار سلسله مراتبی است. پرونده ها در پوشه ها(فولدر) ذخیره می شوند بطوریکه هر پوشه می تواند شامل یک یا چند فایل و یا یک یا چند پوشه ی دیگر باشد. باز هر زیرپوشه می تواند شامل چند پرونده یا پوشه ی دیگر باشد؛ که شبیه ساختار یک درخت می شود. استفاده از پوشه ها، مرتب سازی پرونده ها را آسان تر می کند.

اسمی که به هر پرونده در یک سطح نسبت داده می شود باید یکتا باشد. با این حال در بعضی از سیستم عامل ها، اگر نوع این پرونده ها متفاوت باشد مشکلی ایجاد نمی شود.


روش های سازمان دهی[ویرایش]

در گذشته(از سال 1950 تا اوایل 1970) سازمان ها داده هایشان را با رویکرد فایلی(روش سنتی) سازماندهی می کردند. اما پس از آن به روش مدرن با رویکرد پایگاهی روی آوردند.

روش های متعددی برای سازماندهی پرونده ها در پایگاه داده وجود دارد، که می توانند برای بعضی از دسترسی ها کارآمد و برای بعضی دیگر ناکارآمد باشند. این به عهده ی برنامه نویس است که بهترین روش را برای هدف موردنظر خود انتخاب کند.

بعضی از این روش های سازماندهی ها عبارتند از:

  • سازمان دهی ترتیبی(به انگلیسی: Sequential File Organization)
  • سازمان دهی هرمی(به انگلیسی: Heap File Organization)
  • سازمان دهی با درخت بی‌پلاس(به انگلیسی: B+ Tree File Organization)
  • سازمان دهی خوشه ای(به انگلیسی: Cluster File Organization)
  • روش دسترسی ترتیبی شاخص بندی شده(به انگلیسی: Indexed Sequential Access Method)
  • سازمان دهی با روش درهم سازی/مستقیم(به انگلیسی: Hash/Direct File Organization)

اکنون به شرح بعضی از این روش ها می پردازیم:[۳]

سازمان دهی ترتیبی[ویرایش]

این روش، یکی از ساده ترین روش های سازمان دهی است؛ هر فایل پشت سر فایل دیگر به صورت متوالی قرار می گیرد. این کار می تواند به دو طریق انجام شود:

در سازماندهی ترتیبی رکوردها به صورت متوالی قرار می گیرند

1- هر رکورد که اضافه می شود پشت سر دیگری قرار می گیرد(رکورد جدید به انتهای فایل اضافه می شود). در این روش برای تغییر یا حذف یک رکورد باید آن را در بلوک های حافظه جستجو کرد.


2- در این روش رکورد ها به صورت مرتب شده قرار دارند. رکورد جدیدی که اضافه می شود ابتدا در انتهای پرونده قرار می گیرد و سپس مرتب شده و جای مناسب خود را پیدا می کند.

مزایای این روش:

-مقایسه با سایر روش ها ساده تر است.

-چون اطلاعات در نوار مغناطیسی به صورت ترتیبی ذخیره می شود، با این روش فایل ها می توانند به سادگی در آن به صورت مرتب شده قرار بگیرند.(نوار مغناطیسی حافظه ای ارزان است که ظرفیت ذخیره سازی بالایی هم دارد اما کند است)

عیب این روش:

مرتب کردن رکوردها، زمان بر است و می تواند باعث کندی سامانه شود.

سازمان دهی هرمی[ویرایش]

این روش ساده ترین نوع سازمان دهی است. رکورد ها بدون هیچ ترتیبی به انتهای پرونده اضافه می شوند. اگر بلوک فعلی پر بود، نزدیک ترین بلوک خالی در حافظه پیدا شده و رکورد آنجا ذخیره می شود. این روش شبیه مدل اول ذخیره رکورد در سازماندهی ترتیبی است؛ اما اینجا بلوک های حافظه به صورت ترتیبی پشت سر هم نیستند و ممکن است در هر جای حافظه قرار داشته باشند.

مزایای این روش:

-این روش برای فایل های بسیار کوچک مناسب است چون دسترسی به رکوردها در آنها سریعنر است. اگر حجم پرونده ها زیاد شود، زمان جستجوی خطی برای آنها بالا می رود.

-وقتی که در یک زمان حجم زیادی از داده ها می خواهند وارد پایگاه داده شوند، این روش بسیار مناسبی است.

معایب این روش:

- برای پایگاه داده های بزرگ، زمان جستجو و تغییر در آن بالا می رود که به صرفه نیست.

-به یک مدیریت حافظه قوی و مناسب نیاز دارد تا کارایی از دست نرود. در صورت ناکارامد بودن این مدیریت، بسیاری از بلوک های حافظه بی استفاده می مانند و حافظه به سادگی بزرگ می شود.

سازمان دهی به روش درخت بی پلاس[ویرایش]

این روش، یکی از روش های پیشرفته سازماندهی پرونده از ISAM است که از کلید به عنوان شاخص و ساختار درخت بی پلاس استفاده می کند. درخت بی پلاس مشابه درخت دودویی جستجو است با این تفاوت که راس ها می توانند بیشتر از دو فرزند داشته باشند. در این ساختار همه ی رکورد ها به عنوان برگ ذخیره می شوند و راس ها به برگ ها اشاره گر دارند و خود محتوایی ندارند. نحوه ی اضافه شدن رکورد ها به این درخت بر اساس کلید آنها و مطابق روش اضافه کردن در درخت دودویی جستجو است. در این ساختار:

- یک راس به عنوان ریشه وجود دارد.

-راس های میانی رکورد های نهایی و واقعی را ذخیره نمی کنند بلکه در نهایت به برگ هایی اشاره دارند که رکورد ها را به صورت مرتب شده نگه داری می کند.

-راس های سمت چپ هر راس، مقدار قبل از آن و راس های راست، شامل مقادیر بعد از آن می شوند.

-برگ ها متوازنند؛ به این معنا که فاصله ی همه ی آن ها از ریشه یکسان است.

-پیچیدگی زمانی جستجو در این نوع سازماندهی، خطی است.

-اگر راس های میانی تنها اشاره گر به سمت چپ داشته باشند، ارتفاع درخت کمتر می شود و در نتیجه بازیابی رکوردها سریع تر می شود.

مزایای این روش:

- جستجو بسیار آسان است؛ چون رکوردها تنها در برگ ها آن هم به صورت مرتب و متوالی ذخیره شده اند.

- با کم و زیاد شدن تعداد رکوردها، ساختار درخت هم می تواند رشد کند یا کاهش یابد. اندازه ی درخت هیچ محدودیتی ندارد(همان طور که در ISAM) اینگونه است.

-چون درخت متوازن است، عملیات های حذف، درج یا تغییر تاثیر در کارآمدی ندارد.

عیب این روش:

-برای جداول غیر پویا کارآمد نیست.

سازمان دهی خوشه ای[ویرایش]

در بقیه ی انواع سازماندهی، هر پرونده شامل یک جدول جداگانه است و هر کدام به شیوه های متفاوتی در حافظه ذخیره شده اند. در موقعیت های واقعی، استخراج از یک جدول تنها، مورد نیاز نیست؛ بلکه لازم است دو یا چند جدول با هم ترکیب شوند. برای این حالت سایر سازماندهی ها به اندازه ی کافی سریع نیستند.

در سازماندهی خوشه ای، دو یا چند جدول که معمولا باید با هم استفاده شوند، در یک پرونده به نام خوشه ذخیره می شوند. این پرونده ها دو یا چند جدول را در یک بلوک حافظه نگهداری می کنند و کلیدهایی که آنان را به هم مرتبط می کند تنها یک بار مرتب می شوند. این شیوه، هزینه ی جستجو برای رکورد های متنوع در چند پرونده را کاهش می دهد؛ همه ی رکورد ها یکجا پیدا می شوند و در نتیجه جستجو کارآمد می شود.

سازماندهی به این شیوه در دو روش شاخص بندی و درهم سازی صورت می گیرد.

خوشه ای کردن جداول زمانی انجام می گیرد که:

- نیاز متناوب برای متصل کردن رکورد های دو جدول وجود دارد؛ اگرچه رکوردهای کمی در دو جدول مرتبط باشند.

-اگر رابطه ی یک به چندی بین جداول وجود دارد.

مزیت های سازماندهی خوشه ای:

- این روش، بهترین است برای زمانی که به ترکیب میان رکورد های چند جدول نیاز داریم.

-وقتی که رابطه یک به چندی بین جداول وجود دارد، استفاده از این روش مناسب است.

معایب این روش:

- این روش برای جاولی که معمولا به هم مرتبط نمی شوند یا رابط ی یک به چندی ندارند بهینه نیست.

-اگر قرار است نحوه ی اتصال دو جدول تغییر کند ما نمیتوانیم از این سازماندهی استفاده کنیم؛ چون در این حالت پیمایش پرونده ها زمان زیادی می گیرد.

- این شیوه برای پایگاه داده های بزرگ مناسب نیست چون کارآمدی آن کم است.

فرآیند پشتیبانی[ویرایش]

فرآیند پشتیبانی(به انگلیسی: back up) به رونوشت برداشتن از پرونده های فیزیکی یا مجازی و پایگاه داده ها در یک سایت ثانویه برای شرایطی که سامانه از کار بیفتد، اطلاق می شود. به عبارتی دیگر، در دنیای تکنولوژی اطلاعات، پشتیبان گیری، به فرایند تهیه نسخه های کپی از داده های اصلی گفته می شود که در زمان رخ دادن وقایعی از قبیل از دست دادن اطلاعات بتوان داده های اصلی را بازیابی کرد. این فرآیند بسیار مهم است چراکه حدود 67 درصد از کاربران اینترنت، در موقعیتی اطلاعات خود را از دست می دهند.

برای اشخاص که سامانه و پایگاه داده ای که امن باشد را در دسترس ندارند، دو نوع روش متداول برای بک آپ گرفتن، خریدن هارد درایو اکسترنال یا استفاده از سرویسهای ارائه شده بر روی اینترنت است. هر کاربر می تواند یک کپی از اطلاعات خود را بر روی حافظه flash و یا هارد کامپیوتر ذخیره کند.

اما زمانی که درباره ی یک سازمان بزرگ صحبت می کنیم به علت حجم بالای اطلاعات موجود و همچنین لزوم حفظ امنیت آن، صحیح نیست که کاربران اطلاعات شرکت و داده های کاری را روی درایو دیسک سخت و یا حافظه فلش(به انگلیسی: flash) شخصی خود نگهداری کرده و آن را همه جا همراه خود حمل و نقل نمایند. در این شرایط، تهیه پشتیبان به صورت متمرکز (به انگلیسی: Centralized) که به سادگی تمامی مشکلات را در سطح شبکه های کوچک و بزرگ حل می کند.این روش را می توان با اختصاص یک سرور مجزا با هارد و ظرفیت بالا فقط برای پشتیبان گیری در شبکه پیاده کرد. روش دیگر استفاده از دستگاههای مخصوص این کار است با ظرفیتها،امکانات، و هزینه های مختلف قابل تعریف در شبکه بوده و نیاز به خرید یک سرور با مشخصات بالا برای پشتیبان گیری را در بسیاری از موارد جبران می کنند.[۴]


فایل سیستم ها و مدیر پرونده ها[ویرایش]

مدیر پرونده، رابطی کاربری برای استفاده از پرونده هاست. برنامه های مدیریت فایل، برای ایجاد، بازکردن، ویرایش، اجرا، تغییرنام، تغییرمسیر، کپی، تغییر دسترسی و جستجوی فایل‌ها استفاده می شوند، اما معمولا نمی توانند محتوای پرونده ها را تغییر دهند. هر سیستم عامل یک مدیر پرونده، برای مدیریت فایل های اولیه ی خود دارد. علاوه بر کاربردهای سنتی، بعضی مدیرپنجره‌های پیشرفته‌تر، توانایی برقراری اتصالات شبکه‌ای را هم دارند، مثلاً مدیر فایل استاندارد کی‌دی‌ای، می‌تواند به شکل مستقیم و از طریق پروتکل اف‌تی‌پی یا ان‌اف‌اس به سرورهای دیگر متصل باشد.


یک فایل سیستم برای کنترل نحوه ذخیره و بازیابی اطلاعات استفاده می‌شود. بدون یک سیستم فایل اطلاعات قرار گرفته در فضای ذخیره‌سازی، یک بدنه کلی و بزرگ از اطلاعات خواهد بود که نمی‌توان تشخیص داد یک تکه از اطلاعات در کجا تمام می شود و قسمت بعدی از کجا شروع می شود. انواع مختلفی از سیستم فایل وجود دارد که هر یک دارای ساختار و منطق متفاوتی می‌باشند.

برای مثال، جدول تخصیص فایل (FAT) فایل سیستم اولیه در سیستم‌عاملهای داس و ویندوز می‌باشد.


جستارهای وابسته[ویرایش]


منابع[ویرایش]

  1. روحانی رانکوهی، سید محمدتقی، سیستم و ساختار فایل‌ها، انتشارات جلوه، ۱۳۸۲.
  2. http://www.etymonline.com/index.php?term=file
  3. File Organization in DBMS
  4. [۱]


پیوند به بیرون[ویرایش]