Построение дерева по нуклеотидным последовательностям
Для построения филогенетического дерева была использована последовательность 16S
рибосомальной РНК из малой субъединицы рибосомы.
Все последовательности были взяты из EMBL.
Мнемоника бактерии | Запись EMBL |
BACAN | AB506122 |
BACSU | JN252087 |
CLOTE | X74770 |
ENTFA | AB680193 |
GEOKA | JQ311984 |
LACDA | AB680073 |
LISMO | AJ508749 |
STAES | AB680360 |
STRP1 | AB002521 |
Последовательности были записаны в 1 файл и выровнены программой mascle.
Выравнивание было отправлено на вход программам fdnaml, fdnapars и fdnadist.
Дерево fdnaml:
+-ENTFA +--6 | | +-LISMO | +--7 | | +--STAES | +--3 +--1 | +BACAN | | +--4 | | | +BACSU | | +--5 | | +-----GEOCA | | | +----STRP1 | 2----LACDA | +--------CLOTE
В данном случае имеются только две общие ветви с правильным деревом:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)
(STAES, LISMO, GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1)
Дерево fdnapars:
+--ENTFA | +--6 +--STAES | | | | +--3 +-BACAN | | +--4 | | | +------STRP1 | +--2 | | +-LISMO | +-------------7 | | +BACSU | +--------5 | +-----GEOCA | 1----LACDA | +----------CLOTE
А вот у этого дерева вообще нет ничего общего с правильным!
Матрица расстояний, полученная от программы fdnadist, обработана программами fneighbor (Neighbor-Joining), ffitch и fkitsch.
Neighbor-Joining:
+----GEOCA +-1 +-2 +-BACSU ! ! +-3 +-BACAN ! ! +-5 +-STAES ! ! ! ! +-ENTFA ! +-4 ! +---LISMO ! ! +-----LACDA 6-7 ! +----STRP1 ! +-------CLOTE
У данного дерева наблюдается одна общая ветвь с правильным:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)
Дерево ffitch:
+-ENTFA ! +-1 +--LISMO ! ! ! ! ! ! +-BACSU ! +-7 +-5 ! ! +-3 +-----GEOCA ! ! ! ! ! +-4 +-BACAN ! ! ! +--STAES ! ! +----STRP1 6-2 ! +-----LACDA ! +-------CLOTE
У этого дерева те же общие с правильным, что и у fdnaml:
(GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO)
(STAES, LISMO, GEOKA, BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1)
Дерево fkitsch:
+-LISMO +-8 ! +-ENTFA +-7 ! ! +-BACSU ! ! +-6 +-4 +-5 +-BACAN ! ! ! ! ! +-STAES +-2 ! ! ! +---STRP1 +-3 ! ! ! +---GEOCA --1 ! ! +----LACDA ! +-----CLOTE
Общая ветвь с правильным:
(BACAN, BACSU) против (CLOTE, LACDA, ENTFA, STRP1, STAES, LISMO, GEOKA)
Построение и анализ дерева, содержащего паралоги
Среди белков девяти, отобранных ранее, бактерий были найдены гомологи белка CLPX_BACSU.Для этого был создан банк по файлу с диска Р, содержащему записи банка UniProt. При помощи blastp по банку был произведен поиск гомологов белка с Evalue < 0.001
Среди находок были отобраны только белки, относящиеся к интересующим нас бактериям. С помощью программы seqret были получены последовательности этих белков. Программой muscle было получено выравнивание.
С помощью программы fprotpars по выравниванию было построено дерево:
+--------------------CLPX_STRP1 ! ! +-----------------CLPX_ENTFA +--------------------------------7 ! ! ! ! +-----CLPX_BACSU ! ! ! +-11 ! +--6 ! ! +--CLPX_BACAN ! ! +----10 +-12 ! ! ! ! +--CLPX_GEOKA ! ! ! ! ! +--9 +--------CLPX_LISMO ! ! ! ! +--CLPX_STAES ! +-----------8 ! +--CLPX_CLOTE +--5 ! ! +--HSLU_GEOKA ! ! +-19 ! ! +-18 +--CLPY_BACSU ! ! ! ! ! ! +-17 +-----HSLU_BACAN ! ! ! ! ! ! +----16 +--------HSLU_LISMO ! ! ! ! ! ! +----------15 +-----------HSLU_STAES ! ! ! ! 1 ! ! ! +--HSLU_ENTFA ! ! ! +-------------14 ! +----------------------13 +--HSLU_LACDA ! ! ! ! +--------CLPE_BACSU ! ! ! ! +--------------------2 +--CLPC_STAES ! ! +--4 ! +--3 +--CLPC_BACSU ! ! ! +-----CLPB_CLOTE ! +--------------------------------------------------------RUVB_LISMO
Примеры ортологов и паралогов:
Ортологи (из разных организмов; разделение их общего предка на линии, ведущие к ним, произошло в результате видообразования):
- CLPX_STRP1 и CLPX_ENTFA
- HSLU_GEOKA и HSLU_BACAN
- CLPC_STAES и CLPC_STAES
Паралоги (два гомологичных белка из одного организма):
- CLPE_BACSU и CLPY_BACSU
- CLPX_GEOKA и HSLU_GEOKA
- RUVB_LISMO и HSLU_LISMO