Задания по теме лекции 3
Ответы присылайте на адрес sas@belozersky.msu.ru , в письме обязательно указывайте, что это ответы на вопросы по третьей лекции, а также ваше имя и фамилию.
Важно: в ответах на вопросы второго задания скриншоты страниц и copy-paste английского текста не принимаются, напишите своими словами то, что удалось понять. Скриншоты можно включать в ответ, но они не заменяют связного текста, а могут лишь иллюстрировать его.
Вопросы 1, 2a и 2b обязательны для зачёта задания, 2c — дополнительный.
Крайний срок: утро среды 17 марта, но работы, присланные до 10 марта включительно, будут проверяться более внимательно и благосклонно. Присланные после 15:00 17 марта проверяться не будут.
1. Построение филогенетического дерева по последовательностям
Нарисуйте филогенетическое дерево белков ORF7b из трех коронавирусов, чьи последовательности представлены здесь:
>P0DTD8 ORF7b protein [SARS coronavirus] MIELSLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDHNETCHA >A0A6B9WFM6 Accessory protein 7b [Bat coronavirus RaTG13] MSELSLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDHNETCHA >D2DJX1 Accessory protein 7b [SARS coronavirus Rs_672/2006] MNELTLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDIEEPCNKV
Пояснение: строчка, начинающаяся со знака ">" содержит краткое описание белка, чья последовательность находится в следующей строчке (так называемый fasta-формат для биологических последовательностей).
Листья дерева обозначьте именами последовательностей (первое слово в описании, то есть то, что заключено между знаком ">" и первым пробелом). Дерево рисуйте слева направо, имена листьев — правее самих листьев, узлы дерева — вертикально, ветви — горизонтально.
2. Последовательности гемоглобинов в банке Uniprot
Зайдите на сайт банка Uniprot https://www.uniprot.org/ . Это основной банк последовательностей белков. Тамошние последовательности делятся на хорошо аннотированные (Reviewed) и прочие (Unreviewed). Пока нас интересуют только хорошо аннотированные последовательности (среди Unreviewed много недостоверных и кроме того, последовательности одного и того же белка могут быть представлены в разделе Unreviewed дважды или даже больше под разными идентификаторами).
Попробуйте, пользуясь поиском на сайте Unirpot, ответить на вопросы:
- сколько альфа-цепей и сколько бета-цепей гемоглобинов млекопитающих описано в базе?
есть ли среди них цепи гемоглобинов представителей отряда броненосцев (Cingulata)? Если да, подравняйте их к соответствующим цепям из презентации.
- сколько описано цепей гемоглобинов человека (есть ли ещё субъединицы гемоглобина, помимо альфа и бета, и как они называются?) Попробуйте выяснить что-нибудь о роли какого-нибудь из них в организме.
Подсказки
На главной странице Uniprot найдите гиперссылку Advanced, откроется форма поиска.
Давайте считать, что альфа-цепи гемоглобинов имеют идентификаторы ("Entry name"), начинающиеся с HBA_ (это почти всегда так). Значит, чтобы найти все альфа-цепи млекопитающих, нужно выбрать в верхнем левом окошке формы поиска Entry name[ID] и против него написать HBA_* (звёздочка заменяет любые символы), а в следующем левом окошке выбрать Taxonomy[OS] и против него начать писать латинское название таксона: Mammalia — появится список вариантов, из которого нужно выбрать очевидный (название Mammalia вместе с номером этого таксона в базе).
После завершения поиска найдите на открывшейся странице общее число находок.
Аналогично с бета-цепями — HBB_*. Вместо Mammalia можно вводить другие таксоны (например, Cingulata).
Чтобы найти все гемоглобины человека, можно в качестве таксона указать род Homo, а вместо Entry name искать по Protein name[DE] слово hemoglobin. Внимание: не всё, что так найдётся, будет цепями гемоглобина, читайте краткие описания. Совет: после того, как откроется страница с находками, найдите слева гиперссылку Reviewed и щёлкните по ней (неаннотированные белки — Unreviewed — нам пока не нужны).
В тексте отчёта, чтобы буквы в подравненных последовательностях не съезжали друг относительно друга, нужно представлять их шрифтом постоянной ширины (например, Courier New).