|
Проект "Эволюция белков митохондриальных рибосом"
Постановка задачи
Биологическая задача этого блока состоит в подтверждении или опровержении гипотезы о том, что
митохондрии эукариот произошли от альфапротеобактерий, а не от гаммапротеобактерий.
Для решения это задачи предлагается сравнить последовательности рибосомальных
белков альфа- и гаммапротеобактерий с их ортологами из митохондрий.
Что надо сделать?
Нужно создать выборку ортологичных белков из рибосом митохондрий и построить их
множественное выравнивание. На основе полученного выравнивания создать профиль для
поиска гомологов в бактериях. Провести поиск гомологов в двух группах бактерий.
Провести статистический анализ результатов поиска. Дать ответ на поставленный вопрос. Затем построить филогенетическое
дерево изучаемых последовательностей/доменов и потвердить или не потвердить сделанные
ранее выводы.р>
Создание обучающей выборки, построение выравнивания и профиля
- С помощью SRS из UniProt были получены последовательности рибосомального белка L11 из митохондрий эукариот.
Запрос в SRS для поиска последовательностей:
([uniprot-Description:L11*] & [uniprot-Description:39S*])
По данному запросу найдено 11 эукариотических белков.
Полученный файл с найденными последовательностями в формате FASTA
- На примере последовательности белка RM11_HUMAN из митохондрий человека была определена доменная структура найденной выборки белков.
Все белки из нашей выборки имеют два домена
PF03946 длина 60 а.о
PF00298 длина 73 а.о
Зеленый - домен PF03946, красный PF00298.
Для изучения был взят наиболее длинный из двух доменов - PF00298.
При помощи PFAM было получено выравнивание всех доменов данного типа.
Далее из предыдущего выравнивания было извлечено выравнивание доменов во всех найденных в п. 1 белках.
Примечание: в выравнивании, которое создает Pfam, присутствуют только 6 из 11 найденных в п.1 последовательностей белков.
Полученный файл с выравниванием в формате FASTA и тот же файл, обработанный в GeneDoc.
- Выравнивание полных последовательностей найденных белков было построено с помощью программы muscle на kodomo-count.
Запрос:
muscle -in mit_proteins.fasta -out muscle.ali
Полученный файл с выравниванием в формате ali
Веса последовательностей выборки были рассчитаны c помощью программы pfm пакета PFTOOLS.
Вводимый запрос:
pfw -m muscle.ali > muscle.weighted.ali
Полученный файл
- Для сравнения выравниваний muscle и Pfam была использованна программа mafft, которая выравниванивает полные последовательности по профилю полученного выравнивания из PFAM.
Использованный запрос:
mafft-linsi --seed Pfam_filtered.ali --seed muscle.weighted.ali /dev/null > mafft.fasta
В результате полученное с помощью mafft выравнивание выявило некоторые отличия в выравниваниях PFAM и muscle.
Для дальнейшей работы было взято выравнивание программы mafft.
Как и вслучае с выравниванием muscle веса последовательностей выборки были рассчитаны c помощью программы pfm пакета PFTOOLS.
pfw -m mafft.ali > mafft.weighted.ali
- По взвешенному выравниванию был построен профиль с помощью pfmake.
Использованный запрос:
pfmake -m mafft.weighted.ali /usr/share/pftools23/blosum45.cmp > myprofile.txt
Полученный профиль
Затем данный профиль был нормирован с помощью autoscale.
Использованный запрос:
autoscale -m myprofile.txt > myprofile.scaled.prf
Полученный "нормированный" профиль
Сравнение профилей:
Если сравнивать полученные нами профили, то можно заметить, что они отличаются в параметре Score.
Так у не нормированного профиля SCORE=850, а у нормированного SCORE=706.
При этом коэфициэнты R1 и R2 для нормированного профиля равны 1.4588 и 0.00997259 соответственно, для не нормированного профиля эти значения равны 0.0000000 и 0.0100000
Из этого можно сделать вывод, что именно эти коэфициенты используются программой для нормировки профиля.
Поиск гомологов по профилю, выбор порогового значения веса
- С помощью программы pfsearch был проведен поиск гомологичных белков отдельно для альфапотеобактерий и для гаммапротеобактерий.
Для поиска был использован нормированный вариант профиля.
Каждый поиск проводился по 3 раза с разными значениями порога (5.0, 10.0, 30.0).
Использованные запросы:
pfsearch -C X -f myprofile.scaled.prf Gammaproteobacteria.fasta > gamma.search
pfsearch -C X -f myprofile.scaled.prf Alphaproteobacteria.fasta > alpha.search
где вместо X подставлялись значения порога.
Результаты поиска приведены в таблице
Порог
| Gammaproteobacteria |
Alphaproteobacteria |
5.0 |
621 |
233 |
10.0 |
139 |
68 |
30.0 |
134 |
65 |
- Далее для каждого из 6-ти вариантов поиска были определены
- количество находок с GO идентификатором "рибосома",
- количество находок с GO идентификатором "большая субчастица рибосомы".
Поиск белков с GO идентификатором "клеточный компонент" я решил не проводить, так как рибосома является клеточным компонентом.
Также необходимо было подобрать оптимальное значение порога.
Все вышеперечисленные данные объединены в единую таблицу
|
Gammaproteobacteria |
|
|
Alphaproteobacteria |
|
|
Порог |
Общее количество находок |
с GO идентификатором "рибосома" (0005840) |
c GO идентификатором "большая субчастица рибосомы" (0005762) |
Общее количество находок
| с GO идентификатором "рибосома" (0005840) |
c GO идентификатором "большая субчастица рибосомы" (0005762) |
5.0 |
620 |
185 |
0 |
232 |
91 |
0 |
10.0 |
138 |
138 |
0 |
67 |
67 |
0 |
30.0 |
133 |
133 |
0 |
64 |
64 |
0 |
6.0 |
215 |
139 |
0 |
80 |
67 |
0 |
Помимо данных, приведенных в таблице, поиск гомологов проводился также со значениями порога равными 8.0 и 9.0.
Результаты поиска аналогичны результатам, полученным при значении порога 10.0.
Таким образом, исходя из данных таблицы было принято решение, что пороговое значение 10.0 оптимально для поиска по профилю.
Основной критерий выбора порогового значения - выборка должна содержать как можно больше белков, в анотации которых присутствует идентификатор "рибосома".
Анализ результатов
- По нормированному профилю был проведен поиск с пороговым значением 10.0.
Полученные файлы:
alpha10.0.txt и gamma10.0.txt
Значения весов находок из обоих файлов были импортированы в Excel.
Далее средствами Microsoft Excel были построены 2 гистограммы, приведенные на рисунке.
Из гистограммы видно, что распределение как для альфапротеобактерий, так и для гаммапротеобактерий близко к нормальному.
Если же сравнивать медианы обоих распределений, то медиана распределения для альфапротеобактерий лежит правее, чем медиана распределения для гаммапротеобактерий.
Не стоит упускать из виду и тот факт, что наибольшему значению веса равному 35 соответствует большее количество находок из альфапротеобактерий, чем из гаммапротеобактерий.
И хотя полученные данные и говорят о большем родстве рибосомальных белков эукариот к белкам из альфапротеобактерий, с уверенностью утверждать об этом нет ни малейшего смысла.
Делать какие-то выводы на основе предварительных данных я не решаюсь.
- Сравнил распределения весов находок в двух группах бактерий с помощью теста Вилькоксона.
Для этого была использованна программа STADIA.
Результаты теста:
Вилкоксон=7972, Z=-2,689, Значимость=0,0035, степ.своб = 67,138
Гипотеза 1: <Есть различия между медианами выборок>
Полученные результаты подтвердили существование разницы между выборками.
Это выражается в том, что одна из выборок имеет больший средний вес.
Для того, чтобы понять, какая именно это выборка, я провел поиск медиан и среднего значения.
Полученные с помощью программы STADIA данные:
Медиана Среднее
Альфапротеобактерии 33,01 32,73
Гаммапротеобактерии 32,66 32,37
На основании этих данных можно сделать вывод о том, что последовательности из протеома альфапротеобактерий имеют больший средний вес и потому ближе к исследуемому профилю, чем последовательности гаммапротеобактерий.
Филогенетический анализ
- Создали внешнюю группу последовательностей рибосомальных белков из Firmicutes, имеющих то же название,
что и заданный белок.
Полученная выборка
Создали файлы с найденными в упр.8. последовательностями из альфа- и гаммапротеобактерий.
Описание общей выборки.
Построили объединенное выравнивание митохондриальных белков и белков из рибосом альфа-, гаммапротеобактерий и фирмикут.
Полученное выравнивание в формате phy.
- Методом максимального правдоподобия (phylip proml) было построено филогенетическое дерево:
Изображение дерева из програмы TreeView.
Красным овалом обозначены белки эукариот, желтым-белки из гаммапротеобактерий, голубым-белки из альфапротеобактерий и зеленым- белки из Firmicutes.
Если считать фирмикут корнем, то видно, что сначала происходит разделение на альфапротеобактерий и гаммапротеобактерий, а затем от альфапротеобактерий отделяется группа митохондриальных белков эукариот.
Отсюда можно сделать вывод о том, что митохондриальные белки эукариот эволюционно ближе к альфапротеобактериям.
Полученные результаты согласуются с предварительными данными из п.8 и 9.
- С помощью пакета phylip protdist определелили попарные эволюционные расстояния по JTT и построили гистограмму распределения попарных расстояний между митохондриальными белками и белками из альфа- и гаммапротеобактерий
Полученный Excel-файл со всеми выкладками.
Полученная гистограммма:
Так как данный метод является завершающим в нашем исследовании, можно было бы надеяться на получение точного ответа на вопрос к какой же группе бактерий ближе митохондриальные белки эукариот.
Однако, полученные данные не дают нам этого ответа. Как видно из гистограммы, медианы распределения обеих групп бактерий имеют одинаковое значение. Это свидетельствует о том, что попарные эволюционные расстояния белков из альфа и гаммапротеобактерий от белков эукариот равны.
Таким образом, результаты, полученные данным методом не могут четко описать эволюцию рибосомальных белков из митохондрий эукариот.
Резюме
Основная цель данного исследования - подтвердить или опровергнуть гипотезу о том, что
митохондрии эукариот произошли от альфапротеобактерий, а не от гаммапротеобактерий.
Для достижения поставленной задачи было использовано несколько методов, в основе которых лежит профиль, построенный для поиска белков-гомологов из
гамма- и альфапротеобактерий.
Если же говорить о методах анализа результатов, то все они не подтвердили на 100% описанную выше гипотезу.
По моему мнению, наиболее значимые результаты мы получили с помощью теста Вилкоксона, который наглядно показал разницу между полученными выборками белков из гамма и альфапротеобактерий.
По результатам данного метода можно сделать вывод: вероятно, эволюционно митохондрии эукариот ближе к альфапротеобактериям, нежели чем к гаммапротеобактериям.
По данным же, полученным другими методами составить полную картину эволюции рибосомальных белков из митохондрий эукариот невозможно.
Домашняя страница
Copyright 2009. Голяев Виктор.
|