Занятие 5. Выравнивание последовательностей

Ваша рабочая директория — H:\Term2\Block2\Practice5.

Отчёт должен появиться на вашем веб-сайте к следующему занятию (18 марта для группы 101, 23 марта для группы 102).

Обязательные задания

  1. Скопируйте пару коротких последовательностей из таблицы (против своего имени) в файл "shortseqs.fasta". Запустите программу GeneDoc и импортируйте этот файл (см. подсказки). Выровняйте последовательности, стараясь, чтобы было сопоставлено максимальное число одинаковых букв. Сохраните выравнивание под именем alignment1.msf. В отчёт вставьте изображение выравнивания и ссылку на него. Посчитайте и приведите в отчёте процент идентичности и процент сходства двух последовательностей.

    Указание. Процентом идентичности будем считать отношение числа колонок выравнивания, в которых стоят одинаковые буквы, к общему числу колонок (включая "гэповые"), умноженное на 100%. Процентом сходства будем считать отношение числа колонок со сходными буквами к общему числу, умноженное на 100%. Сходными буквами будем считать такие, для которых значение элемента матрицы BLOSUM62 положительно.
     

  2. Последовательность seq1 из предыдущего задания представляет собой фрагмент последовательности вашего белка. Чтобы определить, какой именно это фрагмент, можно выровнять его с полной последовательностью белка. Существует программа "bl2seq", выдающая частичные выравнивания и предназначенная в первую очередь для выравнивания одинаковых или очень сходных последовательностей.

    Зайдите на сайт "NCBI BLAST": "http://blast.ncbi.nlm.nih.gov/", найдите внизу страницы гиперссылку "Align" и перейдите по ней (это web-интерфейс к программе "bl2seq"). Выберите вкладку "blastp" (это вариант для выравнивания белковых последовательностей). Определите с помощью этого сервиса координаты (начало и конец) последовательности seq1 в полной последовательности вашего белка. Занесите ответ в протокол.
     

  3. Пользуясь тем же сервисом, выровняйте ваш белок с белком, чей ID в банке UniProt указан против вашего имени в таблице. Укажите в отчёте: какие белки из каких организмов Вы выравнивали, проценты идентичности ("Identities") и сходства ("Positives"), число гэпов, координаты выровненного участка (участков, если выдано несколько выравниваний) в обеих последовательностях. Сохраните карту локального сходства в виде gif-файла; желательно, чтобы в имени файла фигурировали идентификаторы последовательностей.
См. указания.

  Если все обязательные задания сделаны, можете приступать к дополнительным заданиям.