Задание к лекции 4 МФК "Биоинформатика"
Реконструируйте филогенетическое дерево нескольких млекопитающих по белку "цитохром Б"
Результат представьте в протоколе (Word'овский файл с картинкой)
Как действовать
открыть страницу Uniprot (http://www.uniprot.org),
- нажать "Advanced" (в правом верхнем углу)
- в верхнем окошке выбрать "Protein name [DE]" и напротив написать "complex 3 subunit 3" (это альтернативное название цитохрома Б, по такому названию легче отобрать только нужные белки)
во втором сверху окошке выбрать "Taxonomy [OC]" и напротив начать набирать слово "Mammalia" (латинское название млекопитающих). Появится подсказка – список возможных таксонов, из которого нужно выбрать правильный (вида "Mammalia[40674]")
- попросите показать 100 (а не 25) первых находок (сообразите, как это сделать!)
- отметьте галочками несколько найденных белков (от 7 до 20). Это стоит делать сознательно, то есть разбираясь, какому именно зверю принадлежит белок! Google (Yandex) translate и Wikipedia в помощь!
- нажмите кнопку Align и дождитесь результата
постарайтесь сохранить картинку с деревом! один из вариантов под Windows – сочетание клавиш Alt+PrtScr (копирует изображение активного окна в буфер) с последующей обрезкой в графическом редакторе. Более правильный путь – сохранить само выравнивание, затем открыть его программой Jalview и в этой программе реконструировать дерево (меню Calculate → Calculate Tree); из методов реконструкции лучше всего пока выбрать "Average Distance Using % Identity". Готовое дерево можно экспортировать из Jalview в формате PNG.
(* – дополнительно) поделитесь своими соображениями о правильности реконструкции.
(** – дополнительно) если интересно, повторите что-то подобное для птиц (Aves), растений (Viridiplantae) или грибов (Fungi).
Дополнительное задание
Говорят, что митохондрии - это потомки бактерий, "прижившихся" в клетках эукариот. Проверьте это!
Статья 2014 г. о реконструкции бактерии - предка митохондрий: Zhang Wang, Martin Wu, Phylogenomic Reconstruction Indicates Mitochondrial Ancestor Was an Energy Parasite
В геноме митохондрий человека закодировано 13 белков. Определите сколько из них имеют гомологов в геноме кишечной палочки
Идентификаторы митохондриальных белков человека такие:
P00846 P03928 P00395 P00403 P00414 P00156 P03886 P03891 P03897 P03901 P03905 P03915 P03923
Откройте страницу программы blast
- выберите protein blast
- внесите в окошко идентификаторы всех 13-и белков (столбиком)
- Выберите параметры:
- Database: Reference proteins
- Organism: Escherichia coli K-12 (taxid:83333)
- Algorithm parameters, Expect threshold: 0.0001 (это значит, что находятся только белки, гомологичные поданному на вход, с вероятностью ошибочного определения гомологичности менее одной десятитысячной)
- BLAST и подождите ответа
Показывается страница находок для первой входной последовательности. Находки изображены графически (разноцветными полосками) и приведены в таблице. В таблице указана вероятность ошибки E value (5e-7 = 5*10(-7), "" обозначает возведение в степень), какая часть входной последовательности гомологична находке Query cover% и процент одинаковых букв в выравнивании.
- Для переключения на вторую и далее входные последовательности выберите их в окошке Results for:
- В протоколе напишите ответ и ваши комментарии о правдоподобности исходного предположения.
Уточнения.
- Я написал не вполне правильно о том, что такое Expect threshold (E-value). Однако для предлагаемых значений E-value оно практически совпадает с вероятностью ошибки, т.е. нахождения негомологичного белка
Кишечная палочка — не ближайший потомок бактерии, ставшей митохондрией. Ближайшего потомка найдете сами, если захотите; для этого можно запустить blast по всем белкам бактерий. Не гарантирую, что ответ получится просто! Сам я не дождался ответа BLAST, ухожу домой. Поэтому не могу проложить надежную тропинку к ответу (( ААл