Построение дерева по нуклеотидным последовательностям
Для построения филогенетического дерева была использована последовательность 16S
рибосомальной РНК из малой субъединицы рибосомы.
Все последовательности были взяты из EMBL.
| Мнемоника бактерии | Запись EMBL |
| BACAN | AB506122 |
| BACSU | JN252087 |
| CLOTE | X74770 |
| ENTFA | AB680193 |
| GEOKA | JQ311984 |
| LACDA | AB680073 |
| LISMO | AJ508749 |
| STAES | AB680360 |
| STRP1 | AB002521 |
Последовательности были записаны в 1 файл и выровнены программой mascle.
Выравнивание было отправлено на вход программам fdnaml, fdnapars и fdnadist.
Дерево fdnaml:
+-ENTFA
+--6
| | +-LISMO
| +--7
| | +--STAES
| +--3
+--1 | +BACAN
| | +--4
| | | +BACSU
| | +--5
| | +-----GEOCA
| |
| +----STRP1
|
2----LACDA
|
+--------CLOTE
В данном случае имеются только две общие ветви с правильным деревом:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)
(STAES, LISMO, GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1)
Дерево fdnapars:
+--ENTFA
|
+--6 +--STAES
| | |
| +--3 +-BACAN
| | +--4
| | | +------STRP1
| +--2
| | +-LISMO
| +-------------7
| | +BACSU
| +--------5
| +-----GEOCA
|
1----LACDA
|
+----------CLOTE
А вот у этого дерева вообще нет ничего общего с правильным!
Матрица расстояний, полученная от программы fdnadist, обработана программами fneighbor (Neighbor-Joining), ffitch и fkitsch.
Neighbor-Joining:
+----GEOCA
+-1
+-2 +-BACSU
! !
+-3 +-BACAN
! !
+-5 +-STAES
! !
! ! +-ENTFA
! +-4
! +---LISMO
!
! +-----LACDA
6-7
! +----STRP1
!
+-------CLOTE
У данного дерева наблюдается одна общая ветвь с правильным:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)
Дерево ffitch:
+-ENTFA
!
+-1 +--LISMO
! ! !
! ! ! +-BACSU
! +-7 +-5
! ! +-3 +-----GEOCA
! ! ! !
! +-4 +-BACAN
! !
! +--STAES
!
! +----STRP1
6-2
! +-----LACDA
!
+-------CLOTE
У этого дерева те же общие с правильным, что и у fdnaml:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)
(STAES, LISMO, GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1)
Дерево fkitsch:
+-LISMO
+-8
! +-ENTFA
+-7
! ! +-BACSU
! ! +-6
+-4 +-5 +-BACAN
! ! !
! ! +-STAES
+-2 !
! ! +---STRP1
+-3 !
! ! +---GEOCA
--1 !
! +----LACDA
!
+-----CLOTE
Общая ветвь с правильным:
(BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO, GEOKA)
Построение и анализ дерева, содержащего паралоги
Среди белков девяти, отобранных ранее, бактерий были найдены гомологи белка CLPX_BACSU.Для этого был создан банк по файлу с диска Р, содержащему записи банка UniProt. При помощи blastp по банку был произведен поиск гомологов белка с Evalue < 0.001
Среди находок были отобраны только белки, относящиеся к интересующим нас бактериям. С помощью программы seqret были получены последовательности этих белков. Программой muscle было получено выравнивание.
С помощью программы fprotpars по выравниванию было построено дерево:
+--------------------CLPX_STRP1
!
! +-----------------CLPX_ENTFA
+--------------------------------7 !
! ! ! +-----CLPX_BACSU
! ! ! +-11
! +--6 ! ! +--CLPX_BACAN
! ! +----10 +-12
! ! ! ! +--CLPX_GEOKA
! ! ! !
! +--9 +--------CLPX_LISMO
! !
! ! +--CLPX_STAES
! +-----------8
! +--CLPX_CLOTE
+--5
! ! +--HSLU_GEOKA
! ! +-19
! ! +-18 +--CLPY_BACSU
! ! ! !
! ! +-17 +-----HSLU_BACAN
! ! ! !
! ! +----16 +--------HSLU_LISMO
! ! ! !
! ! +----------15 +-----------HSLU_STAES
! ! ! !
1 ! ! ! +--HSLU_ENTFA
! ! ! +-------------14
! +----------------------13 +--HSLU_LACDA
! !
! ! +--------CLPE_BACSU
! ! !
! +--------------------2 +--CLPC_STAES
! ! +--4
! +--3 +--CLPC_BACSU
! !
! +-----CLPB_CLOTE
!
+--------------------------------------------------------RUVB_LISMO
Примеры ортологов и паралогов:
Ортологи (из разных организмов; разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования):
- CLPX_STRP1 и CLPX_ENTFA
- HSLU_GEOKA и HSLU_BACAN
- CLPC_STAES и CLPC_STAES
Паралоги (два гомологичных белка из одного организма):
- CLPE_BACSU и CLPY_BACSU
- CLPX_GEOKA и HSLU_GEOKA
- RUVB_LISMO и HSLU_LISMO