Занятие 2Реконструкция филогенетических деревьев1)Пользуясь таксономическим сервисом NCBI были определены таксоны выбранных бактерий:
{STRPN,STRP1,LACLM,LACDA,BACAN,GEOKA,LISMO} vs {CLOTE} -тривиальная ветвь, отделяющая класс Clostridia от представителей класса Bacilli {STRPN,STRP1,LACLM,LACDA} - ветвь,отделяющая бактории порядка Lactobacillales {BACAN,GEOKA,LISMO} - порядок Bacillales {STRPN,STRP1,LACLM} - ветвь, отделяющая бактерий семейства Streptococcaceae {BACAN,GEOKA}- ветвь,объединияющая представителей семейства Bacillaceae 2)Из Swiss-Prot были получены последовательности белков с функцией рибосомного белка L3. 3)Программой muscle было построено множественное выравнивание 5)Реконструкция дерева была произведена программой fprotpars пакета EMBOSS. Было получено 3 дерева: скобочные формулы: ((LISMO,((BACAN,GEOKA),(((STRPN,STRP1),LACLM),LACDA))),CLOTE)[0.3333]; ((LISMO,(GEOKA,(BACAN,(((STRPN,STRP1),LACLM),LACDA)))),CLOTE)[0.3333]; ((GEOKA,(BACAN,(LISMO,(((STRPN,STRP1),LACLM),LACDA)))),CLOTE)[0.3333]; Изображения: +-----------------LISMO ! ! +--BACAN +--5 +-----------7 ! ! ! +--GEOKA ! ! ! ! +--6 +--STRPN ! ! +--4 1 ! +--3 +--STRP1 ! ! ! ! ! +-----2 +-----LACLM ! ! ! +--------LACDA ! +--------------------CLOTE +-----------------LISMO ! +--5 +--------------GEOKA ! ! ! ! +--6 +-----------BACAN ! ! ! ! ! ! +--STRPN ! +--7 +--4 1 ! +--3 +--STRP1 ! ! ! ! ! +--2 +-----LACLM ! ! ! +--------LACDA ! +--------------------CLOTE +-----------------GEOKA ! +--6 +--------------BACAN ! ! ! ! +--7 +-----------LISMO ! ! ! ! ! ! +--STRPN ! +--5 +--4 1 ! +--3 +--STRP1 ! ! ! ! ! +--2 +-----LACLM ! ! ! +--------LACDA ! +--------------------CLOTE Ветви первого дерева: {BACAN,GEOKA} vs {STRPN,STRP1,LACLM,LACDA} {STRPN,STRP1} vs {LACLM,LACDA,BACAN,GEOKA,LISMO,CLOTE} {STRPN,STRP1,LACLM} vs {LACDA,BACAN,GEOKA,LISMO,CLOTE} {STRPN,STRP1,LACLM,LACDA} vs {BACAN,GEOKA,LISMO,CLOTE} {BACAN,GEOKA,STRPN,STRP1,LACLM,LACDA} vs {CLOTE,LISMO} Из них правильные первые четыре. 6)Эволюционные расстояния между последовательностями (программа fprotdist): RL3_CLOTE 0.000000 0.809663 0.685690 0.637641 0.642177 0.708637 0.645141 0.707765 RL3_LACDA 0.809663 0.000000 0.398102 0.407527 0.364714 0.443709 0.449966 0.488398 RL3_LACLM 0.685690 0.398102 0.000000 0.199754 0.184907 0.344516 0.406922 0.355444 RL3_STRP1 0.637641 0.407527 0.199754 0.000000 0.089294 0.254133 0.324896 0.295997 RL3_STRPN 0.642177 0.364714 0.184907 0.089294 0.000000 0.267741 0.318154 0.261682 RL3_LISMO 0.708637 0.443709 0.344516 0.254133 0.267741 0.000000 0.297191 0.251332 RL3_GEOKA 0.645141 0.449966 0.406922 0.324896 0.318154 0.297191 0.000000 0.243719 RL3_BACAN 0.707765 0.488398 0.355444 0.295997 0.261682 0.251332 0.243719 0.000000Пример 1: d(LACLM-STRP1)=0.199754 d(STRP1-STRPN)=0.089294 d(LACLM-STRPN)=0.184907 Отклонение от ультраметричности= 0.199754-0ю184907=0.014847 Пример 2: d(LACDA-LACLM)=0.398102 d(LACLM-STRP1)=0.199754 d(STRP1-STRPN)=0.089294 d(LACDA-STRP1)=0.407527 d(LACLM-STRPN)=0.184907 d(LACDA-STRPN)=0.364714 d(LACDA-LACLM)+d(LACLM-STRPN)=0.398102+0.184907=0.583009 d(LACDA-STRP1)+d(LACLM-STRPN)=0.407527+0.184907=0.592434 d(LACDA-STRPN)+d(LACLM-STRP1)=0.364714+0.199754=0.564468 Отклонение от аддитивности=0.592434-0.583009=0.009425 (+ первые два занчения больше теретьего) 7)Реконструкция дерева,полученная с помощью алгоритмов Neighbor-Joining и UPGMA (программа fneighbor): Алгоритм Neighbor-Joining посторил правильное! дерево,все ветви верные,хотя дерево неукоренное. Ветви дерева,построенного UPGMA: {STRPN,STRP1} vs {LACLM,LACDA,BACAN,GEOKA,LISMO,CLOTE} {STRPN,STRP1,LACLM} vs {LACDA,BACAN,GEOKA,LISMO,CLOTE} {GEOKA,BACAN} vs {LACLM,LACDA,STRPN,STRP1,LISMO,CLOTE} {GEOKA,BACAN,LISMO} vs {LACLM,LACDA,STRPN,STRP1,CLOTE} {GEOKA,BACAN,LISMO,STRPN,STRP1,LACLM} vs {LACDA,CLOTE} Правильные из них 1,2,3,4. Основынм недостатком fprotpars я считаю неединтсвенность ответа программы в ходе реализации метода максимальной экономии. |