Задания по теме лекции 1
Отчёт о выполненных заданиях присылайте Сергею Александровичу Спирину в файле формата Word или аналогичном на адрес <sas AT belozersky DOT msu DOT ru>. Срок — утро 4 марта 2026. Работы, присланные до 25 февраля включительно, будут проверяться более внимательно и благосклонно. Присланные после 15:00 4 марта проверяться не будут.
В письме обязательно указывайте, что это ответы на вопросы по первой лекции, а также ваше имя и фамилию.
Важно: в ответах на вопросы второго задания скриншоты страниц и copy-paste английского текста не принимаются, напишите своими словами то, что удалось понять. Скриншоты можно включать в ответ, но они не заменяют связного текста, а могут лишь иллюстрировать его.
Вопросы 1, 2a и 2b обязательны для зачёта задания, 2c — дополнительный.
1. Визуализация филогенетического дерева набора организмов
Выберите 8–10 животных (можно растений или грибов, можно других организмов). Для каждого определите латинское название (род и вид, Wikipedia в помощь!). По латинскому названию на сайте NCBI Taxonomy определите его полную таксономию. Заполните таблицу из трёх столбцов, в первом русское название организма (если не удалось его найти — прочерк), во втором — латинское (род и вид), в третьем — полная таксономия.
- Укажите самый младший таксон, общий для всех этих организмов
Напишите скобочную формулу филогенетического дерева этих организмов. В качестве названий организмов в формуле можно использовать родовые названия (если все ваши организмы из разных родов) или выражения вида род - подчёркивание - вид (например, "Homo_sapiens")
Визуализируйте дерево сервисом iTOL
В отчёте должны присутствовать:
- Заголовок (что это вообще такое? Например "Отчёт по первому заданию МФК "Биоинформатика"")
- Ваше имя и фамилия
- Краткое объяснение того, что делалось
- Таблица (см. выше), с заголовком и заголовками столбцов
- Латинское (а если есть, то и руское) название самого младшего общего таксона (с объяснением, что это)
- Скобочная формула дерева (с объяснением, что это)
- Изображение дерева (с объяснением, что это и как получено)
Подсказки
В большинстве случаев работает такая схема: находите животное в Википедии (если не находится в единственном числе, попробуйте во множественном), статья может быть посвящена одному виду или группе видов, в последнем случае, скорее всего, там будет список этих видов. В статье обязательно будет латинское название вида (или названия видов). В крайнем случае попробуйте перевести русское название на английский и поискать в англоязычной Википедии.
Родовое название вносите в окно поиска в NCBI Taxonomy, обычно сразу находится единственный вариант, изредка бывают синонимы (например, Bacillus — это и бактерия, и насекомое палочник), тогда выбираете по смыслу. На странице рода сверху полная таксономия — это последовательность латинских названий таксонов, самый старший будет "cellular organisms", самый младший — род, к которому относится организм. Скопируйте последовательность в третью колонку своей таблицы. Латинское название организма (род и вид, вторая колонка) желательно оформить курсивом (italic), род — с заглавной буквы, вид — со строчной.- Самый младший таксон — это самый правый (например, для человека и мыши самый младший общий таксон — это Euarchontoglires, а для человека и слона — Eutheria). Названия таксонов более высокого ранга, чем род, не принято оформлять курсивом.
Про скобочную формулу см. на стр. 26 презентации. В отличие от примера, в вашем дереве могут быть политомии (например, три вида одного рода), с ними тоже всё просто, пример:
(A_b,(C_d, C_e, C_f));
(если сразу не понятно, как это будет выглядеть, самостоятельно визуализируйте в iTOL). Следите, чтобы число открывающих скобок совпадало с числом закрывающих.
2. Последовательности гемоглобинов в банке Uniprot
Зайдите на сайт банка Uniprot https://www.uniprot.org/ . Это основной банк последовательностей белков. Тамошние последовательности делятся на хорошо аннотированные (Reviewed) и прочие (Unreviewed). Пока нас интересуют только хорошо аннотированные последовательности (среди Unreviewed много недостоверных; кроме того, последовательности одного и того же белка могут быть представлены в разделе Unreviewed дважды или даже больше под разными идентификаторами).
Попробуйте, пользуясь поиском на сайте Unirpot, ответить на вопросы:
- сколько альфа-цепей и сколько бета-цепей гемоглобинов млекопитающих (Mammalia) описано в базе?
есть ли среди них цепи гемоглобинов представителей отряда броненосцев (Cingulata)? Если да, подравняйте их к соответствующим цепям из презентации (стр. 20–22).
- (*) сколько описано цепей гемоглобинов человека (есть ли ещё субъединицы гемоглобина, помимо альфа и бета, и как они называются)? Попробуйте выяснить что-нибудь о роли какого-нибудь из них в организме (зачем у человека есть ещё и такая цепь, чем отличается её роль от роли альфа и бета и т.п.)
Подсказки
На главной странице Uniprot найдите гиперссылку Advanced, откроется форма поиска.
Давайте считать, что альфа-цепи гемоглобинов имеют идентификаторы ("Entry name"), начинающиеся с HBA_ (это почти всегда так). Значит, чтобы найти все альфа-цепи млекопитающих, нужно выбрать в верхнем левом окошке формы поиска Entry name[ID] и против него написать HBA_* (звёздочка заменяет любые символы), а в следующем левом окошке выбрать Taxonomy[OС] и против него начать писать латинское название таксона: Mammalia — появится список вариантов, из которого нужно выбрать очевидный (название Mammalia вместе с номером этого таксона в базе).
После завершения поиска найдите на открывшейся странице общее число находок.
Аналогично с бета-цепями — HBB_*. Вместо Mammalia можно вводить другие таксоны (например, Cingulata).
Чтобы найти все гемоглобины человека, можно в качестве таксона указать род Homo, а вместо Entry name искать по Protein name[DE] слово hemoglobin. Внимание: не всё, что так найдётся, будет цепями гемоглобина, читайте краткие описания. Совет: после того, как откроется страница с находками, найдите слева гиперссылку Reviewed и щёлкните по ней (неаннотированные белки — Unreviewed — нам пока не нужны).
В тексте отчёта, чтобы буквы в подравненных последовательностях не съезжали друг относительно друга, нужно представлять их шрифтом постоянной ширины (например, Courier New).
