Занятие 4
Построение дерева по нуклеотидным последовательностям
Использованные программы:
seqret -sask
дабы получить последовательность по указанным координатам,
less *.fasta >> all.fasta
дабы объединить в один файл.
Я использовал
fdnaml, fdnapars, fdnadist + fneighbor/ffitch/fkitsch,то есть все программы
Ни одна из програм не дала полностью верного дерева.
Лучшими были результаты fneighbor, ffitch, к тому же получившиеся идентичными.
В отчете изображено fneighbor дерево.
Информация:
ID name coordinates
AL009126 BACSU 9810..11364
CP001598 BACAN 9233..10741
FR773526 CLOB1 9246..10747
CP002491 ENTFA 669063..670611
AE015927 CLOTE 176113..177621
AP008971 FINM2 197837..199361
BA000043 GEOKA 10421..11973
CP002559 LACAC 57091..58665
Дерево отличается от правильного отсутствием ветви {LACAC,ENTFA}
Помимо этого были еще варианты, отличающиеся примерно в "области" этой же ветви.
О качестве: ошибка в одной из ветвей наблюдалась и при применении некоторых алгоритмов для белковых последовательностей,
однако в случае белков были и дающие правильный результат программы.
В целом качество НК-подхода ниже, т.к. разница в нуклеотидах не означает разницы в свойствах остатка
(другой нуклеотид в триплете может изменить смысл триплета на родственный АК остаток или совсем не изменить)
поэтому оценить значимость замены нуклеотида в эволюционном ключе сложнее
Вдобавок, при выравнии muscle'ом нулеотидов штраф за несоответствие одинаковый, то есть качество выравнивания уступает таковому для белков.
Построение и анализ дерева, содержащего паралоги
Для поиска гомологов использовался blastp c предварительным makeblastdb из пакета EMBOSS на кодомо. Нашлесь 18 хороших гомологов
Выравнивание производилось программой muscle
Для постороения деревьев использовалась программа fprotpars.
ортологами можно считать:
CLPX_BACSU и CLPX_BACAN;
HSLU_ENTFA и HSLU_LACAC;
CLPX_CLOB1 и CLPX_CLOTE;
парологами можно считать:
CLPX_ , CLPY_ , CLPE_ и CLPC_ из
Bacillus subtilis;
CLPX_ и CLPB_ из
Clostridium tetani .
B0S222_FINM2, B0S3J0_FINNM2, B0S3X9_FINM2, B0S0E3_FINM2 и B0S2N5_FINM2; *** - FIN = FINM2