کلادوگرام
یک کلادوگرام یک دیاگرام است که رابطه اجدادی بین گونه و تکامل درخت حیات را نمایش میدهد.اگر چه بصورت سنتی چنین کلادوگرامهایی بر اساس مشخصات مورفولوژی مشخص میشدند اما دادههای دنباله دیانای، آرانای و فیلوژنتیک محاسباتی بصورت معمولتر در تولید کلادوگرامها نقش دارند.
محتویات |
تولید یک کلادوگرام [ویرایش]
یک الگوریتم حریصانه برای تولید یک کلادوگرام این طور هست که:
- جمعآوری و سازماندهی کلادوگرامها
- فراهم آوردن کلادوگرامهای ممکن
- انتخاب بهترین کلادوگرام
مرحله ۱: جمعآوری و سازماندهی دادهها [ویرایش]
یک آنالیز کلادیستیک با دادههای زیر شروع میشود:
- یک فهرست از تکساها(برای نمونه گونهها)که سازماندهی شدهاند.
- یک فهرست از کارکترها برای مقایسه شدن.
- برای هر تاکسون مقادیر هر یک از کارکترهای فهرست شده.
برای نمونه اگر، ۲۰ گونه از پرندگان را آنالیز کنیم، دادههای ممکن بصورت زیر میباشد:
- فهرست ۲۰ گونه
- کارکترهایی همانند دنباله ژنوم، آناتومی اسکلتی، پروسسهای بیوشیمیایی و رنگآمیزی پرها میباشد.
- برای هر ۲۰ گونه دنباله ژنوم، آناتومی اسکلتی، پروسسهای بیوشیمیایی و رنگآمیزی پر مخصوص به آن.
تمام دادهها سپس در ماتریس کارکتر-تاکسون جمعآوری میشوند که اساس انجام آنالیزهای فیلوژنتیکی میباشد.
دادههای مورفولوژیکی در مقابل دادههای مولکولی [ویرایش]
کارکترهای مورد استفاده شده برای ایجاد یک کلادوگرام میتواند بطور کلی در هر یک از مورفولوژیها سازمان دهی شوند (synapsid skull، warm blooded، notochord، unicellular، غیره.)یا مولکولی (DNA، RNA، یا دیگر اطلاعات ژنتیکی).قبل از ظهور دنباله های DNA تمام آنالیزهای کلادوگرام داده های مورفولوژی را استفاده می کردند. همانطور که تعیین توالی دیانای ارزان تر وساده تر گردید، فیلوژنتیک ملکولی روش مشهورتر و مشهور تری برای ایجادتکامل نژادی شد.[۲] با استفاده از معیار پارسیمونی که یکی از چندین روش برای پی بردن به تکامل نژادی از داده های مولکولی می باشد.درستنمایی بیشینه واستنباط بیزی، که مدلهای صریحی از تکامل دنباله تاسیس می کنند، روشهای non-Hennigian برای ارزیابی داده هاای دنباله می باشند.روشهای قدرتمند دیگر از تکامل نژادی با استفاده از ژنوم retrotransposon marker می باشد که به مساله reversionکه داده های دنباله را مبتلا می کند کمتر مستعد می باشد.آنها بصورت معمول فرض می شوند که وقوع کمتری از تشابه ساختمانی دارند زیراسابقا فکر میشد که اجتماعشان با ژنوم ها کاملا تصادفی است.بهر حال لاقل بنظر میرسددر بعضی مواقع این چنین نمی باشد. بصورت مطلول، مورفولوژی، مولکولی و دیگر فیلوژنهای ممکن باید درون یک آنالیز از total evidence ترکیب شوند:تمام آنها منابع ذاتی متفاوتی از خطاها دارند.برای نمونه همگرایی کاراکتر (فرگشت همگرا) در داده های مورفولوژی نسبت به داده های دنباله مولکولی معمول تر است، اما معکوس کارکتر که غیر قابل فهم هستند در حروف معمول ترند(ببینید long branch attraction را).تشابه ساختمانی مورفولوژیکی میتواند بطور معمول همنینطور تشخیص داده شود.اگر وضعیت کارکترها با جوئیات تعریف شده باشد.
Plesiomorphies and synapomorphies [ویرایش]
محققان باید تصمیم بگیرند که حالت کارکتر باید قبل از آخرین جد مشترک ازگروه گونه ها باشد (plesiomorphies) و یااینکه در آخرین جد مشترک نمایش داده شوند(synapomorphies)، و بنابراین توسط یکی یا بیشتر از outgroups ها انجام گیرد.انتخواب یکی از outgroup ها یکی از مراحل اساسی در آنالیز کلادیستیک می باشد، زیرا outgroup های متفاوت میتوانند درخت هایی با توپولوژی های بسیار متفاوت تولید کنند.
اجتناب از تشابه ساختمانی [ویرایش]
یک فرگشت همگرا یک مشخصه است که بوسیله گونه های متفاوت بعلت بعضی از مسایل بجز جد مشترک به اشتراک گذاشته شده است .دو نوع اصلی از هموپلاسی همگرایی (وجود مشخصه یکسان در حداقل دو جد مجزا)و معکوس (بازگشت به یک کاکتر اجدادی)می باشد.استفاده از هموپلاسی در هنگام ایجاد یک کلادوگرام اجتناب ناپذیر است اما در حد امکان اجتناب شده است.یک نمونه شناخته شده از هموپلاسی بعلت همگرایی تکامل مشخصه "presence of wings" خواهد بود. با توجه به اینکه بال پرندگان، خفاش و حشرات تابع یکسانی را بکار می گیرند، هر تغییر مستقلانه، می تواند بوسیله آناتومی شان دیده شود.اگر یک پرنده، خفاش و دیگر حشرات بالدار برای مساله "presence of wings" امتیاز بندی شده باشند، یک هموپلاسی در دیتا ست، واین آنالیز را گیج خواهد کرد، نتایج احتمالی را در یک سناریوی غلط معرفی خواهد کرد.آن ممکن است که غیر قابل اجتناب باشد که کارکترهایی که تعریفشان مبهم است را تعریف کنیم. هموپلاسی ها می توانند اغلب آشکارادر در دیتا ست های مورفولوژیکی بوسیله تعریف دقیق کارکترها و افزایش تعدادشان اجتناب گردند، در غیر اینصورت کارکتر ها ممکن است به تمام کل taxa ها انجام نگیرد;با ادامه دادن به مثال بالها، حضور بالها به سختی کارکتر مفیدی خواهد بود اگر یک phylogenyرا از تمام Metazoaجستجو کنیم، بطوری که هیچ کدام از اینها اصلا بالی ندارند.بنابراین انتخواب دقیق وتعریف کارکترها یک عنصر اساسی در آنالیز کلادیستیکی می باشد.با یک مجموعه کارکتر و outgroup ناقص، هیچ روشی برای تولید نمایش فیلوژنی بصورت واقعی وجود ندارد.
مرحله ۲: فراهم کردن کلادوگرام های ممکن [ویرایش]
وقتی تعداد کمی از گونه ها سازمان دهی شده اند می توان این مرحله را بصورت دستی انجام داد, اما در حالات دیگر نیاز به برنامه کامپیوتری می باشد.امتیازاتی از برنامه های کامپیوتر در دسترس برای پشتیبانی از کلادیستیک ها در دسترس می باشند. برای اطلاعات بیشتر درباره برنامه های کامپیوتری تولید درخت درخت فیلوژنتیک را ببینید.بعلت اینکه تعداد کل کلادوگرام های ممکن براساس تعداد گونه ها بصورت فاکتوریلی رشد می کنند, ارزیابی هر کلادوگرام شهودی برای برنامه های کامپیوتری غیر ممکن می باشد.یک برنامه کلادیستیک معمول بااستفاده از تکنیک های هیوریستیک شروع می گردد تا یک تعداد کم از کلادوگرام های کاندیدا را ایجاد نماید.تعدادی از برنامه های کلادیستیک سپس جستجویی با مراحل زیر را ادامه می دهند:
- ارزیابی کلادوگرام های ممکن با استفاده از مقایسه داده های کارکتری آنها
- مشخص کردن بهترین کاندیداهایی که بیشترین سازگاری را باداده های کارکتری دارند
- ایجاد کاندیداهای اضافه بوسیله ایجاد نمونه های مختلف از هر یک از بهترین کاندیدا ها در مرحله قبلی
- بااستفاده از هیوریستیک ایجاد چندین کلادوگرام کاندیدای جدید با استفاده از کاندیداهای قبلی
- تکرار این مراحل تا اینکه کلادوگرام های با بهترین ها متوقف شوند
برنامه های کامپیوتری که کلادوگرام ها را تولید می کنند الگوریتم هایی با شدت محاسباتی خیلی بالا را استفاده می کنند, زیرا مساله کلادوگرام انپی سخت می باشد.
مرحله3: انتخواب بهترین کلادوگرام [ویرایش]
چندین الگوریتم برای مشخص کردن بهترین کلادوگرام وجود دارد.بیشتر الگوریتم ها یک metric را برای اندازه گیری اینکه چقدر یک کلادوگرام با داده هایش پایدار می باشد را اندازه گیری می نماید.بیشتر الگوریتم های کلادوگرام تکنیک های ریاضی optimization وminimization را استفاده می نمایند. در حالت معمول الگوریتم های تولید کلادوگرام بایستی بصورت برنامه های کامپیوتری اجرا گردند, اگرچه تعدادی از الگوریتم ها می توانند بصورت دستی هنگامی که تعداد داده بدیهی می باشند بدست آیند. تعدادی از الگوریتم ها وقتی که داده های کامپیوتری مولکولی (DNA,RNA) می باشند مفید هستند.و تعدادی هنگامی که داده های کارکتری مورفولوژیک هستند مفید می باشند.و بعضی دیگر از الگوریتم ها هنگامی که داده ها بصورت مولکولی یا مورفولوژی می باشند مفید هستند. الگورتیم ها برای کلادوگرام کمترین مربعات, اتصال-همسایگی, تیغ اوکام, درستنمایی بیشینه, واستنباط بیزی را شامل می باشند. بیولوژیست ها اکثر مواقع اصطلاح تیغ اوکام را برای یک نوع مشخص از الگوریتم های تولید کلادوگرام وگاهی اوقات بعنوان یک واژه جامع برای تمام الگوریتم های کلادوگرام استفاده میشود. الگوریتم هایی که وظایف بهینه سازی را انجام میدهند(همانند ایجاد کلادوگرام ها)می توانند حساس به اندازه داده های ورودی (لیست گونه ها و کارکتر هایشان)که نمایش داده شده است باشند.وارد کردن ورودی در واحدهای زمانی متفاوت می تواند منجر به این گردد که الگورتم های مشابه بهترین کلادوگرام ها ی متفاوت را تولید نمایند.در این حالت کاربر بایستی ورودی را در واحدهای زمانی متفاوت وارد نماید و نتایج را مقایسه کند. استفاده از داده متفاوت روی داده یکسان می تواند گاهی بهترین کلادوگرام های متفاوت را تولید نماید, زیرا ممکن است هر کدام تعریف مشخصی از بهترین را داشته باشند. بعلت تعداد نجومی از کلادوگرام های ممکن, الگوریتم ها نمی توانند گارنتی کنند که جواب در کل بهترین جواب می باشد.یک کلادوگرام غیر بهینه اگر برنامه روی یک مینیمم محلی در عوض مینیمم سراسری قرارداده شده باشد انتخواب گردد.برای حل کردن این مساله تعدادی از الگوریتم های کلادوگرام رویکرد الگوریتم تبرید شبیهسازی شده را استفاده می کنند.
منابع [ویرایش]
- ↑ DeSalle, Rob (2002). Techniques in Molecular Systematics and Evolution. Birkhauser. ISBN 376436257X.
- ↑ Hillis, David (1996). Molecular Systematics. Sinaur. ISBN 0878932828.
| در ویکیانبار پروندههایی دربارهٔ کلادوگرام موجود است. |