Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Практикум 9. Выравнивание последовательностей белка.

Результаты — в виде отдельной страницы на своём сайте, со ссылкой со страницы семестра. Срок без штрафа — 12 дня 17 апреля, с минимальным штрафом — 24 апреля.

При затруднениях см. указания.

0. Установите себе Jalview

Для работы из дома необходимо установить на своём компьютере программу Jalview. Инструкции см. здесь.

1. Глобальное парное выравнивание гомологичных белков

Скачайте из Uniprot два списка идентификаторов (ID) записей: всех аннотированных (Reviewed, то есть из Swiss-Prot) записей, чей идентификатор кончается на _ECOLI (то есть из штамма K12 кишечной палочки) и всех аннотированных записей, чей идентификатор кончается на _BACSU (то есть из штамма 168 сенной палочки).

Определите те пары белков из двух списков, чьи идентификаторы Swiss-Prot которые имеют одинаковую мнемонику функции (например, в идентификаторе ENO_ECOLI мнемоникой функции является ENO). Выберите три пары белков. Выровняйте последовательности каждой пары программой needle при параметрах по умолчанию. Создайте и заполните таблицу вида:

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков

 
Protein Name

 
ID 1

 
ID 2

 
Score

 
% Identity

 
% Similarity

 
Gaps

 
Indels

 
Enolase

 
ENO_ECOLI

 
ENO_BACSU

 
1351.0

 
62.1%

 
74.8%

 
20

 
5

Столбцы таблицы: рекомендованное полное имя (если таковые различаются в двух записях Swiss-Prot, в таблицу вставляйте то, что приведено для кишечной палочки, но в сноске под таблицей обязательно укажите на разночтение!), идентификаторы двух белков в Swiss-Prot, вес выравнивания, процент совпадающих букв, процент сходных букв, число гэпов, число инделей. Замечания: 1) не выбирайте мнемоники функций, начинающиеся на букву Y — это как правило белки с неизвестной функцией и скорее всего даже при совпадении мнемоник белки из разных организмов не будут гомологичны; 2) не выбирайте мнемонику ENO.

2. Локальное парное выравнивание гомологичных белков

Те же пары белков выровняйте программой water, тоже при параметрах по умолчанию. Создайте и заполните таблицу вида:

 
Protein Name

 
ID 1

 
ID 2

 
Score

 
% Identity

 
% Similarity

 
Gaps

 
Indels

 
Coverage 1

 
Coverage 2

 
Enolase

 
ENO_ECOLI

 
ENO_BACSU

 
1359.0

 
64.1%

 
77.2%

 
7

 
3

 
98.1%

 
97.9%

Дополнительные столбцы: проценты покрытия первого и второго белка выравниванием (с округлением до десятых процента).

3. Результат применения программ выравнивания к неродственным белкам

Выберите какую-нибудь случайную пару белков c разными мнемониками функций. Проведите глобальное и локальное выравнивание. В отчёте приведите характеристики выравниваний и свои комментарии.

4. Сохранение выравнивания в fasta-формате и импорт в Jalview.

Возьмите одну из пар белков из упражнения 1. Снова выполните выравнивание их последовательностей программой needle, но теперь укажите в качестве выходного формата fasta. Имя выходного файла должно иметь расширение fasta, fa или mfa (я рекомендую первый вариант, то есть fasta).

Запустите Jalview и импортируйте полученное выравнивание в него. Покрасьте буквы по проценту идентичности. Закройте все лишние окна, внутри окна Jalview должно остаться только окно с выравниванием. Сохраните проект Jalview (см. в кратком руководстве: https://kodomo.fbb.msu.ru/wiki/Main/JalView ). В отчёте нужны только заголовок упражнения и строка вида: "Глобальное выравнивание белков <такого-то> и <такого-то> в виде проекта Jalview", оформленная как гиперссылка на файл с проектом.

5. Множественное выравнивание белков

Для одной из мнемоник функций, выбранных в упр.1, найдите в Swiss-Prot все белки, чьи идентификаторы начинаются с этой мнемоники. Укажите в отчёте, сколько таких белков нашлось. Выберите пять из них. Выполните множественное выравнивание этих пяти белков вместе с соответствующими белками из ECOLI и BACSU. Результат представьте в виде проекта Jalview, с раскраской по проценту идентичности. Никаких окон, кроме окна с выравниванием, в проекте оставаться не должно. Обязательны комментарии: все ли белки хорошо выровнялись, все ли они, по вашему мнению, гомологичны, есть ли у выравнивания выраженная структура: более консервативные и менее консервативные участки.