Kodomo

Пользователь

Задания по теме лекции 3

Ответы присылайте на адрес sas@belozersky.msu.ru , в письме обязательно указывайте, что это ответы на вопросы по третьей лекции, а также ваше имя и фамилию.

Важно: в ответах на вопросы второго задания скриншоты страниц и copy-paste английского текста не принимаются, напишите своими словами то, что удалось понять. Скриншоты можно включать в ответ, но они не заменяют связного текста, а могут лишь иллюстрировать его.

Вопросы 1, 2a и 2b обязательны для зачёта задания, 2c — дополнительный.

Крайний срок: утро среды 17 марта, но работы, присланные до 10 марта включительно, будут проверяться более внимательно и благосклонно. Присланные после 15:00 17 марта проверяться не будут.

1. Построение филогенетического дерева по последовательностям

Нарисуйте филогенетическое дерево белков ORF7b из трех коронавирусов, чьи последовательности представлены здесь:

>P0DTD8 ORF7b protein [SARS coronavirus]
MIELSLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDHNETCHA
>A0A6B9WFM6 Accessory protein 7b [Bat coronavirus RaTG13]
MSELSLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDHNETCHA
>D2DJX1 Accessory protein 7b [SARS coronavirus Rs_672/2006]
MNELTLIDFYLCFLAFLLFLVLIMLIIFWFSLELQDIEEPCNKV

Пояснение: строчка, начинающаяся со знака ">" содержит краткое описание белка, чья последовательность находится в следующей строчке (так называемый fasta-формат для биологических последовательностей).

Листья дерева обозначьте именами последовательностей (первое слово в описании, то есть то, что заключено между знаком ">" и первым пробелом). Дерево рисуйте слева направо, имена листьев — правее самих листьев, узлы дерева — вертикально, ветви — горизонтально.

2. Последовательности гемоглобинов в банке Uniprot

Зайдите на сайт банка Uniprot https://www.uniprot.org/ . Это основной банк последовательностей белков. Тамошние последовательности делятся на хорошо аннотированные (Reviewed) и прочие (Unreviewed). Пока нас интересуют только хорошо аннотированные последовательности (среди Unreviewed много недостоверных и кроме того, последовательности одного и того же белка могут быть представлены в разделе Unreviewed дважды или даже больше под разными идентификаторами).

Попробуйте, пользуясь поиском на сайте Unirpot, ответить на вопросы:

  1. сколько альфа-цепей и сколько бета-цепей гемоглобинов млекопитающих описано в базе?
  2. есть ли среди них цепи гемоглобинов представителей отряда броненосцев (Cingulata)? Если да, подравняйте их к соответствующим цепям из презентации.

  3. сколько описано цепей гемоглобинов человека (есть ли ещё субъединицы гемоглобина, помимо альфа и бета, и как они называются?) Попробуйте выяснить что-нибудь о роли какого-нибудь из них в организме.

Подсказки

На главной странице Uniprot найдите гиперссылку Advanced, откроется форма поиска.

Давайте считать, что альфа-цепи гемоглобинов имеют идентификаторы ("Entry name"), начинающиеся с HBA_ (это почти всегда так). Значит, чтобы найти все альфа-цепи млекопитающих, нужно выбрать в верхнем левом окошке формы поиска Entry name[ID] и против него написать HBA_* (звёздочка заменяет любые символы), а в следующем левом окошке выбрать Taxonomy[OS] и против него начать писать латинское название таксона: Mammalia — появится список вариантов, из которого нужно выбрать очевидный (название Mammalia вместе с номером этого таксона в базе).

После завершения поиска найдите на открывшейся странице общее число находок.

Аналогично с бета-цепями — HBB_*. Вместо Mammalia можно вводить другие таксоны (например, Cingulata).

Чтобы найти все гемоглобины человека, можно в качестве таксона указать род Homo, а вместо Entry name искать по Protein name[DE] слово hemoglobin. Внимание: не всё, что так найдётся, будет цепями гемоглобина, читайте краткие описания. Совет: после того, как откроется страница с находками, найдите слева гиперссылку Reviewed и щёлкните по ней (неаннотированные белки — Unreviewed — нам пока не нужны).

В тексте отчёта, чтобы буквы в подравненных последовательностях не съезжали друг относительно друга, нужно представлять их шрифтом постоянной ширины (например, Courier New).