Kodomo

Пользователь

Задания по теме лекции 3

Отчёт о выполненных заданиях присылайте Сергею Александровичу Спирину в файле формата Word или аналогичном на адрес <sas AT belozersky DOT msu DOT ru>. Срок — утро 23 марта 2022. Работы, присланные до 16 марта включительно, будут проверяться более внимательно и благосклонно. Присланные после 15:00 23 марта проверяться не будут.

В письме обязательно указывайте, что это ответы на вопросы по третьей лекции, а также ваше имя и фамилию.

Важно: в ответах на вопросы второго задания скриншоты страниц и copy-paste английского текста не принимаются, напишите своими словами то, что удалось понять. Скриншоты можно включать в ответ, но они не заменяют связного текста, а могут лишь иллюстрировать его.

Вопросы 1, 2a и 2b обязательны для зачёта задания, 2c — дополнительный.

1. Построение филогенетического дерева по последовательностям

Нарисуйте филогенетическое дерево белков ORF7b из четырёх коронавирусов, чьи последовательности представлены здесь:

>P0DTD8
MIELSLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDHNETCHA
>A0A6B9WFM6
MSELSLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDHNETCHA
>A0A8F0ZVA0
MSELTLIDFYLCFLAFLLFLVLIMLIIFWFSLEIQDSEEPRSKV
>A0A8F0ZU57
MSELTLIDFYLCFLAFLLFLVLIMLIIFWFSLEIQDSEEPCPKV

Пояснение: строчка, начинающаяся со знака ">" содержит имя последовательности, сама же последовательность находится в следующей строчке (так называемый fasta-формат для биологических последовательностей).

Листья дерева обозначьте именами последовательностей (без знака ">"). Дерево рисуйте слева направо, имена листьев — правее самих листьев, узлы дерева — вертикально, ветви — горизонтально.

(*) Дополнительно: опишите, какие мутации произошли на каждой из ветвей дерева

2. Последовательности гемоглобинов в банке Uniprot

Зайдите на сайт банка Uniprot https://www.uniprot.org/ . Это основной банк последовательностей белков. Тамошние последовательности делятся на хорошо аннотированные (Reviewed) и прочие (Unreviewed). Пока нас интересуют только хорошо аннотированные последовательности (среди Unreviewed много недостоверных; кроме того, последовательности одного и того же белка могут быть представлены в разделе Unreviewed дважды или даже больше под разными идентификаторами).

Попробуйте, пользуясь поиском на сайте Unirpot, ответить на вопросы:

  1. сколько альфа-цепей и сколько бета-цепей гемоглобинов млекопитающих (Mammalia) описано в базе?
  2. есть ли среди них цепи гемоглобинов представителей отряда броненосцев (Cingulata)? Если да, подравняйте их к соответствующим цепям из презентации.

  3. (*) сколько описано цепей гемоглобинов человека (есть ли ещё субъединицы гемоглобина, помимо альфа и бета, и как они называются)? Попробуйте выяснить что-нибудь о роли какого-нибудь из них в организме (зачем у человека есть ещё и такая цепь, чем отличается её роль от роли альфа и бета и т.п.)

Подсказки

На главной странице Uniprot найдите гиперссылку Advanced, откроется форма поиска.

Давайте считать, что альфа-цепи гемоглобинов имеют идентификаторы ("Entry name"), начинающиеся с HBA_ (это почти всегда так). Значит, чтобы найти все альфа-цепи млекопитающих, нужно выбрать в верхнем левом окошке формы поиска Entry name[ID] и против него написать HBA_* (звёздочка заменяет любые символы), а в следующем левом окошке выбрать Taxonomy[OS] и против него начать писать латинское название таксона: Mammalia — появится список вариантов, из которого нужно выбрать очевидный (название Mammalia вместе с номером этого таксона в базе).

После завершения поиска найдите на открывшейся странице общее число находок.

Аналогично с бета-цепями — HBB_*. Вместо Mammalia можно вводить другие таксоны (например, Cingulata).

Чтобы найти все гемоглобины человека, можно в качестве таксона указать род Homo, а вместо Entry name искать по Protein name[DE] слово hemoglobin. Внимание: не всё, что так найдётся, будет цепями гемоглобина, читайте краткие описания. Совет: после того, как откроется страница с находками, найдите слева гиперссылку Reviewed и щёлкните по ней (неаннотированные белки — Unreviewed — нам пока не нужны).

В тексте отчёта, чтобы буквы в подравненных последовательностях не съезжали друг относительно друга, нужно представлять их шрифтом постоянной ширины (например, Courier New).

Main/mf_2022s/tasks3 (последним исправлял пользователь sas 2022-03-09 13:54:33)