پایگاه داده توالی‌ها

از ویکی‌پدیا، دانشنامهٔ آزاد
(تغییرمسیر از پایگاه داده ی رشته ها)
پرش به: ناوبری، جستجو

در علم بیوانفورماتیک، پایگاه دادهٔ توالی‌ها مجموعه‌ای شامل توالی اسید نوکلئیک ‌رایانه‌ای‌شده (دیجیتال)، توالی پروتئینی ‌رایانه‌ای‌شده و دیگر رشته‌های ذخیره شده در کامپیوتر می‌باشد. این پایگاه داده همچنین می‌تواند شامل یک رشته از یک ارگانیسم باشد (یک پایگاه داده برای هر یک از پروتئین‌های موجود در Saccharomyces cerevisiae) و یا شامل تمام رشته‌های پروتئینی تشکیل دهنده یک مولکول دی‌ان‌ای باشد.

نتایج بررسی[ویرایش]

پایگاه داده توالی‌ها می‌تواند توسط روشهای مختلفی جستجو شود. معمول ترین روش، جستجوی یک توالی مشابه یک پروتئین یا ژن است که این پروتئین یا ژنی دارای توالی شناخته شده‌ای برای کاربر باشد. برنامه بلاست یک روش از این نوع است.

داده‌های منتج به تناقض[ویرایش]

مشکل عمده اکثر پایگاه داده‌های توالی ژنتیکی این است که رکوردها رنج وسیعی از منابع شامل محققان تا مراکز بزرگ تعیین توالی ژنوم را در بر می‌گیرند. در نتیجه هر یک ازتوالی‌ها (و بخصوص تفسیرهای زیستی متصل شده به این توالی‌ها) به خودی خود از نظر کمیت و محتوا بسیار گسترده می‌شوند. علاوه بر این آزمایشگاههای مختلف توالی‌های متعددی را ثبت می‌کنند که با توالی‌های موجود در پایگاه داده یکسان یا تقریبا یکسانند.

بسیاری از تفسیرها بر اساس تحقیقات آزمایشگاهی نیستند و براساس جستجوی توالی‌های مشابه با توالی‌های تفسیر شدهٔ قبلی می‌باشند. واضح است که زمانی که یک توالی بر اساس شباهتش به دیگر توالی‌ها تفسیر می‌شود و سپس در پایگاه داده ذخیره می‌شود، بقیهٔ تفسیرها هم ممکن است از روی آن انجام شود. که این باعث بوجود آمدن مشکل تفسیرهای متعدد می‌شود، زیرا چندین تفسیر ممکن است موجود باشد که یا بر اساس رشته‌های مشابه بدست آمده و یا بر اساس اطلاعات تجربی است که از آزمایشگاه‌ها بدست آمده. بنابراین همیشه بایستی به ترجمه‌های زیستی موجود در پایگاه دادهٔ توالی‌ها با شک و تردید نگریست.

منابع[ویرایش]

مشارکت‌کنندگان ویکی‌پدیا، «Sequence database»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد (بازیابی در ۲۵ ژوئن ۲۰۱۲).

جستارهای وابسته[ویرایش]

پیوند به بیرون[ویرایش]

پانویس[ویرایش]