Задания по теме лекции 1
Отчёт о выполненных заданиях присылайте Сергею Александровичу Спирину в файле формата Word или аналогичном на адрес <sas AT belozersky DOT msu DOT ru>. Срок — утро 21 февраля 2024. Работы, присланные до 14 февраля включительно, будут проверяться более внимательно и благосклонно. Присланные после 15:00 21 февраля проверяться не будут.
В письме обязательно указывайте, что это ответы на вопросы по первой лекции, а также ваше имя и фамилию.
Важно: в ответах на вопросы второго задания скриншоты страниц и copy-paste английского текста не принимаются, напишите своими словами то, что удалось понять. Скриншоты можно включать в ответ, но они не заменяют связного текста, а могут лишь иллюстрировать его.
Вопросы 1, 2a и 2b обязательны для зачёта задания, 2c — дополнительный.
1. Построение филогенетического дерева по последовательностям
Нарисуйте филогенетическое дерево белков ORF7b из четырёх коронавирусов, чьи последовательности представлены здесь:
>P0DTD8 MIELSLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDHNETCHA >A0A6B9WFM6 MSELSLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDHNETCHA >A0A8F0ZVA0 MSELTLIDFYLCFLAFLLFLVLIMLIIFWFSLEIQDSEEPRSKV >A0A8F0ZU57 MSELTLIDFYLCFLAFLLFLVLIMLIIFWFSLEIQDSEEPCPKV
Пояснение: строчка, начинающаяся со знака ">" содержит имя последовательности, сама же последовательность находится в следующей строчке (так называемый fasta-формат для биологических последовательностей).
Листья дерева обозначьте именами последовательностей (без знака ">"). Дерево рисуйте слева направо, имена листьев — правее самих листьев, узлы дерева — вертикально, ветви — горизонтально.
(*) Дополнительно: опишите, какие мутации произошли на каждой из ветвей дерева
2. Последовательности гемоглобинов в банке Uniprot
Зайдите на сайт банка Uniprot https://www.uniprot.org/ . Это основной банк последовательностей белков. Тамошние последовательности делятся на хорошо аннотированные (Reviewed) и прочие (Unreviewed). Пока нас интересуют только хорошо аннотированные последовательности (среди Unreviewed много недостоверных; кроме того, последовательности одного и того же белка могут быть представлены в разделе Unreviewed дважды или даже больше под разными идентификаторами).
Попробуйте, пользуясь поиском на сайте Unirpot, ответить на вопросы:
- сколько альфа-цепей и сколько бета-цепей гемоглобинов млекопитающих (Mammalia) описано в базе?
есть ли среди них цепи гемоглобинов представителей отряда броненосцев (Cingulata)? Если да, подравняйте их к соответствующим цепям из презентации.
- (*) сколько описано цепей гемоглобинов человека (есть ли ещё субъединицы гемоглобина, помимо альфа и бета, и как они называются)? Попробуйте выяснить что-нибудь о роли какого-нибудь из них в организме (зачем у человека есть ещё и такая цепь, чем отличается её роль от роли альфа и бета и т.п.)
Подсказки
На главной странице Uniprot найдите гиперссылку Advanced, откроется форма поиска.
Давайте считать, что альфа-цепи гемоглобинов имеют идентификаторы ("Entry name"), начинающиеся с HBA_ (это почти всегда так). Значит, чтобы найти все альфа-цепи млекопитающих, нужно выбрать в верхнем левом окошке формы поиска Entry name[ID] и против него написать HBA_* (звёздочка заменяет любые символы), а в следующем левом окошке выбрать Taxonomy[OС] и против него начать писать латинское название таксона: Mammalia — появится список вариантов, из которого нужно выбрать очевидный (название Mammalia вместе с номером этого таксона в базе).
После завершения поиска найдите на открывшейся странице общее число находок.
Аналогично с бета-цепями — HBB_*. Вместо Mammalia можно вводить другие таксоны (например, Cingulata).
Чтобы найти все гемоглобины человека, можно в качестве таксона указать род Homo, а вместо Entry name искать по Protein name[DE] слово hemoglobin. Внимание: не всё, что так найдётся, будет цепями гемоглобина, читайте краткие описания. Совет: после того, как откроется страница с находками, найдите слева гиперссылку Reviewed и щёлкните по ней (неаннотированные белки — Unreviewed — нам пока не нужны).
В тексте отчёта, чтобы буквы в подровненных последовательностях не съезжали друг относительно друга, нужно представлять их шрифтом постоянной ширины (например, Courier New).