Задание к лекции 2
Результаты выполнения задания (до того, как будет создана соответствующая форма, о чем будет объявлено дополнительно) присылайте в виде документов Word (.doc, .docx) или LibreOffice (.odt) на электронный адрес: udavdasha <at> fbb.msu.ru.
Основное задание
Последовательность белка L22 из Escherichia coli в формате FASTA дана ниже:
>gi|16131194|ref|NP_417774.1| 50S ribosomal subunit protein L22 [Escherichia coli str. K-12 substr. MG1655] METIAKHRHARSSAQKVRLVADLIRGKKVSQALDILTYTNKKAAVLVKKVLESAIANAEHNDGADIDDLK VTKIFVDEGPSMKRIMPRAKGRADRILKRTSHITVVVSDR
С помощью web-интерфейса программы BLAST (http://blast.ncbi.nlm.nih.gov/Blast.cgi) найдите родственные ему белки у следующих организмов:
Homo sapiens (животное)
Arabidopsis thaliana (зеленое растение)
Halobacterium salinarum NRC-1 (галофильная архея)
Указания:
- Проводите поиск сходных белков отдельно по каждому требуемому организму. Для этого введите латинское название организма в соответствующее поле и выберите его еще раз из появляющегося списка.
Проводите поиск по базе данных Uniprot/SwissProt.
- Из результатов поиска отберите такие находки, которые:
- по длине примерно соответствуют исходному белку;
выравнивание с исходным белком занимает не менее половины его длины (удобно отсортировать список находок, который находится сразу после графической выдачи, по Query coverage - щелкните на заголовок этого столбца, и результат будет отсортирован).
Сохраните выравнивания для таких находок из каждого организма в текстовый файл (или файлы). Выравнивание можно выделить мышью и скопировать в файл через буфер обмена (Ctrl + C, Ctrl + V). Обязательно запишите в файл также параметры каждого выравнивания, которые выдает программа.
(Для дополнительного задания) Сохраните последовательности отобранных находок из человека и Halobacterium salinarum NRC-1. Для сохранения последовательности нужного хита щелкните на кнопке Download, которая находится в первой строке каждого хита, и из выпадающего меню выберите пункт FASTA: complete sequence (выбран по умолчанию). Затем нажмите на кнопку Continue и выберите подходящее имя для получившегося файла. Его можно будет открыть обычным "Блокнотом" в Windows. В нем будет содержаться последовательность белка и краткая информация о нем, в таком же виде, как и вверху страницы с этим заданием.
Ответьте на следующие вопросы:
Сколько находок вы отобрали для каждого организма? Приведите % абсолютно совпадающих аминокислотных остатков (identity) и % сходных остатков (similarity) для этих находок, общую длину выравнивания, длину выбранного белка.
- Если в одном организме имеется несколько отобранных находок, то попытайтесь объяснить, почему там получилось.
Дополнительное задание (для зачета не обязательно)
Сравните между собой последовательности, отобранные у Halobacterium salinarum NRC-1, и последовательности, отобранные у человека (каждую с каждой). Это можно сделать с помощью опции Align two or more sequences на страничке BLAST.
- Сохраните выравнивания и их параметры в отдельный файл.
Ответьте на вопрос: к белкам какого организма оказываются ближе белки археи Halobacterium salinarum NRC-1: к бактерии Escherichia coli или к человеку? Подтвердите свой вывод с помощью полученных данных.