Учебная страница курса биоинформатики,
год поступления 2021
Задание по теме "гомология и выравнивание"
Результат:
- Тривиальная часть - описание одного семейства доменов по информации из Pfam и Uniprot
- Нетривиальная (самому или самой надо думать и принимать решения) - одно выравнивание двух подгрупп доменов одного семейства; обоснование правильности выделения подгрупп указанием различий между выравниванием одной погруппы и другой подгруппах; различий подгрупп от всех остальных доменов семейства.
Отнеситесь к заданию как к игре с выравниванием:) Очень надеюсь на ваш интерес. ААл
Методы:
- Сервисы базы данных Pfam
- Редактор выравниваний Jalview
- Blast выравнивание 2х последовательностей, в формате Dot Plot
- Uniprot поиск и скачивание результата в табличном формате
1. Выберите семейство доменов из Pfam для анализа
От выбора зависит всё дальнейшее
Ограничения, направлены на то, чтобы обезопасить вас от больших технических трудностей, они не являются абсолютными
- Число последовательностей в выборке seed не менее 20
- Число последовательностей в выборке full не более 200
- Число доменных архитектур белков с доменом из семейства не менее 3; две или более должны быть представлены не менее, чем в 20-ю белками.
2. Опишите семейство доменов
- Включите в отчёт название, ID, AC и функцию домена (коротко)
- Укажите число последовательностей (full) и число последовательностей в выравнивании seed
- Укажите число доменных архитектур с этим доменом
- Выберите две достаточно представленные доменные архитектуры и укажите какие именно выбрали, их названия и число белков с каждой из них
Укажите число разных белков с доменом семейства, для которых известна 3D структура. Разные структуры одного и того же белка (по Uniprot ID) считать за одну.
- Укажите число белков с доменом по таксонам самого высокого ранга. Типично - по суперцарствам(они же домены жизни) - бактерии, археи, эукариоты. Если все белки, например, из Firmicutes, то берите след. по рангу таксоны..
- Посмотрите на HMM профиль выравнивания и укажите дату создания (в начале файла) и число позиций (номера позиций указаны в первой колонке профиля).
Много всего, зато думать для выполнения не надо, а надо быстро ориентироваться в ссылках - что вы умеете - и копи-паст. Задуматься по выполнении не запрещается:)
3. Постройте карту локального сходства (Dot Plot) двух белков с доменом семейства, но с разной доменной архитектурой
Придумайте эволюционный сценарий наблюдаемого: что произошло в эволюции от последнего общего предка. Воображение поможет, наукообразие не обязательно, всё равно никто не знает правильного ответа:)
4. В выравнивании доменов семейства выделите на основании сходства две подгруппы доменов Pfam
В ответе - выравнивание, содержащее обе подгруппы и обоснование различий подгрупп и отличий от всех остальных доменов семейства.
5. Сохраните таблицу со всеми белками из Uniprot с доменом семейства Pfam
В таблице сохраните колонки:
- ID
- AC
- Название белка
- Принадлежит ли Swissprot или Trembl
- длина последовательности
- организм
- protein existence
- состав доменов Pfam в белке
- таксономия высшего уровня, на котором есть различия
Дополнительные
- (*) Коротко опишите эксперимент Ленского (wiki)
- (*) Коротко опишите эксперимент А.С.Кондрашева (труднее. Статья 2020 года, искать в Pubmed. Первый автор Безменова А.В.; В статье см. Материалы и методы)
UNDER CONSTRUCTION
.