На главную
Назад

Занятие 4



Построение дерева по нуклеотидным последовательностям

Использованные программы:
seqret -sask 
дабы получить последовательность по указанным координатам,
less *.fasta >> all.fasta 
дабы объединить в один файл.
Я использовал fdnaml, fdnapars, fdnadist + fneighbor/ffitch/fkitsch,то есть все программы
Ни одна из програм не дала полностью верного дерева.
Лучшими были результаты fneighbor, ffitch, к тому же получившиеся идентичными.
В отчете изображено fneighbor дерево.
Информация:
ID       name   coordinates

AL009126 BACSU  9810..11364
CP001598 BACAN  9233..10741
FR773526 CLOB1  9246..10747
CP002491 ENTFA  669063..670611
AE015927 CLOTE  176113..177621
AP008971 FINM2  197837..199361
BA000043 GEOKA  10421..11973
CP002559 LACAC  57091..58665

Дерево отличается от правильного отсутствием ветви {LACAC,ENTFA}
Помимо этого были еще варианты, отличающиеся примерно в "области" этой же ветви.
О качестве: ошибка в одной из ветвей наблюдалась и при применении некоторых алгоритмов для белковых последовательностей,
однако в случае белков были и дающие правильный результат программы.
В целом качество НК-подхода ниже, т.к. разница в нуклеотидах не означает разницы в свойствах остатка
(другой нуклеотид в триплете может изменить смысл триплета на родственный АК остаток или совсем не изменить)
поэтому оценить значимость замены нуклеотида в эволюционном ключе сложнее
Вдобавок, при выравнии muscle'ом нулеотидов штраф за несоответствие одинаковый, то есть качество выравнивания уступает таковому для белков.


Построение и анализ дерева, содержащего паралоги

Для поиска гомологов использовался blastp c предварительным makeblastdb из пакета EMBOSS на кодомо. Нашлесь 18 хороших гомологов
Выравнивание производилось программой muscle
Для постороения деревьев использовалась программа fprotpars.



ортологами можно считать:
CLPX_BACSU и CLPX_BACAN;
HSLU_ENTFA и HSLU_LACAC;
CLPX_CLOB1 и CLPX_CLOTE;
парологами можно считать:
CLPX_ , CLPY_ , CLPE_ и CLPC_ из Bacillus subtilis;
CLPX_ и CLPB_ из Clostridium tetani .
B0S222_FINM2, B0S3J0_FINNM2, B0S3X9_FINM2, B0S0E3_FINM2 и B0S2N5_FINM2; *** - FIN = FINM2