Проект "Эволюция белков митохондриальных рибосом"

Постановка задачи

Биологическая задача этого блока состоит в подтверждении или опровержении гипотезы о том, что митохондрии эукариот произошли от альфапротеобактерий, а не от гаммапротеобактерий.

Для решения это задачи предлагается сравнить последовательности рибосомальных белков альфа- и гаммапротеобактерий с их ортологами из митохондрий.

Что надо сделать?

Нужно создать выборку ортологичных белков из рибосом митохондрий и построить их множественное выравнивание. На основе полученного выравнивания создать профиль для поиска гомологов в бактериях. Провести поиск гомологов в двух группах бактерий. Провести статистический анализ результатов поиска. Дать ответ на поставленный вопрос. Затем построить филогенетическое дерево изучаемых последовательностей/доменов и потвердить или не потвердить сделанные ранее выводы.

В конце блока преподаватели попробуют объединить результаты работы всех студентов в единую картинку эволюции митохондриальной рибосомы.

Создание обучающей выборки, построение выравнивания и профиля

  1. С помощью SRS получить из UniProt последовательности заданного рибосомального белка из митохондрий разных эукариот. Сохранить в одном файле все найденные последовательности в формате FASTA. Сохранить коды доступа и идентификаторы в двух отдельных файлах.

  2. Определить доменную структуру найденных белков, можно на примере последовательности из митохондрий человека. Если доменов несколько, то можно ограничиться исследованием самого длинного. Получить из PFAM выравнивание всех доменов данного типа. Из полученного выравнивания извлечь выравнивание доменов во всех найденных в п. 1 белках. В GenеDoc удалить колонки, состоящие только из гэпов.

  3. Построить выравнивание полных последовательностей найденных белков (п. 1) с помощью программы muscle на kodomo-count. Рассчитать веса последовательностей выборки c помощью программы pfm пакета PFTOOLS

  4. Сравнить в GenеDoc выравнивания из пунктов 3 и 2. Если выравнивание muscle представляется менее удачным, то можно воспользоваться программой mafft для выравнивания полных последовательностей по профилю полученного выравнивания из PFAM.

  5. По взвешенному выравниванию построить профиль с помощью pfmake. Затем нормировать профиль с помощью autoscale. Сравнить "простой" и "нормированный" профили.

    Cм. подсказки.

Поиск гомологов по профилю, выбор порогового значения веса

Файлы со всеми аминокислотными последовательностями из альфа- и гаммапротеобактерий (Alphaproteobacteria.fasta, Gammaproteobacteria.fasta) можно найти в директории P:/y07/Term4/Block3.
  1. C помощью программы pfsearch пакета PFTOOLS провести поиск гомологичных белков в обеих заданных группах бактерий. Использовать нормированный вариант профиля. Каждый поиск повторить 3 раза с разными значениями порога (варианты - 5.0, 10.0, 30.0). Выходные файлы сохранить.

  2. Для каждого из 6-ти вариантов поиска определить
    • общее количество находок,
    • количество находок с GO идентификатором "клеточный компонент",
    • количество находок с GO идентификатором "большая (или малая) субчастица рибосомы".
    Числа занести в таблицу. На основании полученных данных выбрать оптимальное значение порога.

    Cм. подсказки.

Анализ результатов

  1. Провести поиск по нормированному профилю с выбранным значением порога.
    Значения весов находок по заданному профилю импортировать в Excel. Построить две гистограммы: распределение весов находок в альфа- и распределение весов находок в гаммапротеобактериях. Сравнить распределения и сделать вывод.

  2. Сравнить распределения весов находок в двух группах бактерий с помощью теста Вилькоксона. Сделать вывод.

Филогенетический анализ

  1. Создать внешнюю группу (out-группу) последовательностей рибосомальных белков из Firmicutes, имеющих то же название, что и заданный белок. Нужно получить 5-7 последовательностей из разных родов.
    Создать файлы с найденными в упр.8. последовательностями из альфа- и гаммапротеобактерий. Для дальнейшей работы удобно добавить к названию белка метку таксона, например, в файле последовательностями из альфапротеобактерий провести тотальную текстовую замену ">..." на ">a....".
    Построить объединенное выравнивание митохондриальных белков и белков из рибосом альфа-, гаммапротеобактерий и фирмикут.

  2. Построить филогенетическое дерево методом максимального правдоподобия. Получить его изображение с помощью, например, TreeView. Сравнить полученные результаты с выводами к пп.8 и 9.

  3. Определить попарные эволюционные расстояния по Джуксу-Кантору с помощью программы protdist пакета EMBOSS. Построить гистограммы распределения попарных расстояний между митохондриальными белками и белками из альфа- и гаммапротеобактерий. Сравнить полученные результаты с выводами к пп.8 и 9.

Дополнительные задания

  1. Найти лучших гомологов заданного рибосомального белка из митохондрий человека с помощью blastp (сайт NCBI) в бактериях, в альфапротеобактериях и в гаммапротеобактериях. Сравнить с ранее полученными результатами.

  2. Повторить то же, но с помощью программы psiBlast. Сравнить результаты.