Учебная страница курса биоинформатики,
год поступления 2022
Задание по теме "гомология и выравнивание"
1. Выберите семейство доменов из Pfam для анализа
Рекомендуемые ограничения
- Число последовательностей в выборке seed не менее 30 и не более 100
- Число последовательностей в выборке full не более 400
- Число доменных архитектур белков с доменом из семейства не менее 3; две или более архитектур должны быть представлены не менее, чем 10-ю белками.
- Известна 3D структура домена
Ограничения направлены на то, чтобы обезопасить вас от больших технических трудностей, ограничения не являются абсолютными.
Домен интересного вам белка, не очень выбивающийся по числу последовательностей seed (не тысячи последовательностей), можно выбрать. Труднее смотреть выравнивание глазами (Jalview поможет), но интереснее. Что предпочесть?
Ограничить число последовательностей в выравнивании можно выбором последовательностей из таксона (см. указания)
2. Кратко опишите семейство
Включите формальные данные AC семейства (PF-номер), ID, название, Число последовательностей в seed и full.
Число доменных архитектур. Можно написать что-нибудь про них, если найдёте что-нибудь интересное.
Опишите что-нибудь о функции и/или 3D структуре домена. То - что понятно вам, на русском языке и так, чтобы было интересно вам, значит, и читателю. Не старайтесь перевести всё, что написано в аннотациях. Лучше меньше - да лучше!
Напишите, что хотите, о таксономической распространенности домена.
Всё пишите коротко и понятно.
3. Опишите выравнивание seed с точки зрения гомологичности всех последовательностей или их подмножества
- См. уточнение в указаниях
4. Выберите две доменные архитектуры с выбранным доменом. Верно ли, что домены, входящие в состав белков с разной доменной архитектурой, достоверно различаются?
Укажите в отчёте какие это доменные архитектуры и сколько белков с каждой из архитектур в выравнивании full или seed - том, с которым вы работаете.
Как проверить см. указания
.