ماتریس وزن موقعیت خاص

از ویکی‌پدیا، دانشنامهٔ آزاد
پرش به: ناوبری، جستجو

ماتریس وزن موقعیت خاص (به انگلیسی: PWM) یک روش متداول برای نمایش موتیف‌ها (الگوها) در رشته‌های زیستی است.
پی‌دبلیوام (PWM) ماتریس امتیازدهی است که که به هر زیررشته با طول مشخص یک امتیاز (وزن) اختصاص می‌دهد. در ماتریس به ازای هر یک از حروف الفبا (مثلا در رشته‌های اسید نوکلئیکی A,T,C و G) یک سطر و به ازای هر موقعیت الگو یک ستون وجود دارد. امتیازی که پی‌دبلیوام به یک زیررشته اختصاص می‌دهد s=(s_j)_{j=1}^N به شکل \textstyle \sum_{j=1}^{N}{m_{s_j,j}} تعریف می‌شود که در آن j موقعیت در زیررشته، s_j حرف ظاهر شده در موقعیت j و m_{\alpha,j} امتیازی است که در درایهٔ (\alpha,j) ماتریس وجود دارد. به بیان دیگر امتیاز پی‌دبلیوام مجموع امتیازات تک تک حروف ظاهر شده در زیررشته‌است.

پی‌دبلیوام اساسی با لگاریتم درست نمایی[ویرایش]

پی‌دبلیوام فرض می‌کند که موقعیت‌ها در الگو از هم مستقل هستند، از این رو امتیاز هر موقعیت را بدون در نظر گرفتن سایر موقعیت‌ها محاسبه می‌کند. امتیاز زیررشته‌ای که با پی‌دبلیوام همتراز شده می‌تواند به صورت لگاریتم درست‌نمایی، تحت ضرب توزیع چندجمله‌ای ترجمه شود. از آنجایی که هر ستون لگاریتم درست نمایی را برای هر یک از حروف مشخص می‌کند، در حالی که جمع درست‌نمایی روی هر ستون برابر مقدار یک می‌شود، ماتریس پی‌دبلیوام به توزیع چندجمله‌ای مرتبط می‌شود. امتیاز پی‌دبلیوام جمع لگاریتم‌های درست نمایی است که در واقع به معنای ضرب درست‌نمایی هاست. امتیازات پی‌دبلیوام را همچنین می‌توان در قالب فیزیکی نیز ترجمه کرد، که بیانگر مجموع انرژی‌های همهٔ نوکلئوتیدهایی (حرووف زیررشته) است که با پی‌دبلیوام همتراز شده‌اند.

ترکیب کردن توزیع‌های پس زمینه[ویرایش]

بجای استفاده از لگاریتم درست‌نمایی که در پاراگراف قبل بحث شد، بسیاری از روش‌ها از امتیازهای لوجیت در پی‌دبلیوام استفاده می‌کنند. یک درایه در پی‌دبلیوام با m_{i,j}=log(p_{i,j} / b_i) محاسبه می‌شود که در آن p_{i,j} احتمال مشاهدهٔ حرف i در موقعیت j ام موتیف بوده و b_i احتمال مشاهدهٔ حرف i در مدل پس‌زمینه (background) است. در نتیجه در مدل تولیدی، امتیاز پی‌دبلیوام برابر لوجیت زیررشته‌ای است که توسط موتیف تولید شده‌است (در مقابل تولید توسط پس زمینه).

محتوای اطلاعات یک پی‌دبلیوام[ویرایش]

محتوای اطلاعات یک پی‌دبلیوام بیانگر این است که چقدر ماتریس پی‌دبلیوام از توزیع یکنواخت فاصله دارد. خویش-اطلاعات مشاهدهٔ یک حرف خاص در موقعیت خاص موتیف از رابطهٔ زیر به دست می‌آید:

-\log(p_{i,j})

میانگین خویش-اطلاعات یک درایهٔ خاص در پی‌دبلیوام برابر است با:

-p_{i,j} \cdot \log(p_{i,j})

در نهایت محتوای اطلاعات پی‌دبلیوام مجموع میانگین خویش-اطلاعات هر درایه‌است:

\textstyle -\sum_{i,j} p_{i,j}\cdot \log(p_{i,j})

استفاده از پی‌دبلیوام‌ها[ویرایش]

الگوریتم‌های متعددی وجود دارند که از پی‌دبلیوام استفاده می‌کنند. به عنوان مثال الگوریتم تطبیق که در ModuleMaster پیاده سازی شده‌است. بسیاری از الگوریتم‌هایی که خیلی سریع پایگاه داده را یا اسید نوکلئیک‌ها و یا آمینو اسید‌ها می‌گردند در نرم افزار possumsearch پیاده‌سازی شده‌اند.

منابع[ویرایش]

مشارکت‌کنندگان ویکی‌پدیا، «Position-specific scoring matrix»، ویکی‌پدیای انگلیسی، دانشنامهٔ آزاد.