Занятие 4. Выравнивание последовательностей

Ваша рабочая директория — H:\Term2\Practice4.

Обязательные задания

  1. Скопируйте пару коротких последовательностей из таблицы (против своего имени) в файл "shortseqs.fasta". Запустите программу GeneDoc и импортируйте этот файл (см. подсказки). Выровняйте последовательности, стараясь, чтобы было сопоставлено максимальное число одинаковых букв. Сохраните выравнивание под именем alignment1.msf. Посчитайте и занесите в протокол процент идентичности и процент сходства двух последовательностей.

    Указание. Процентом идентичности будем считать отношение числа колонок выравнивания, в которых стоят одинаковые буквы, к общему числу колонок (включая "гэповые"), умноженное на 100%. Процентом сходства будем считать отношение числа колонок со сходными буквами к общему числу, умноженное на 100%. Сходными буквами будем считать такие, для которых значение элемента матрицы BLOSUM62 положительно.
     

  2. Последовательность seq1 из предыдущего задания представляет собой фрагмент последовательности вашего белка. Чтобы определить, какой именно это фрагмент, можно выровнять его с полной последовательностью белка. Существует программа "bl2seq", выдающая частичные выравнивания и предназначенная в первую очередь для выравнивания одинаковых или очень сходных последовательностей.

    Зайдите на сайт "BLAST 2 SEQUENCES": "http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi" (это web-интерфейс к программе "bl2seq"). Определите с помощью этого сервиса координаты (начало и конец) последовательности seq1 в полной последовательности вашего белка. Занесите ответ в протокол.
     

  3. Пользуясь тем же сервисом, выровняйте ваш белок с белком, указанным против вашего имени в таблице. Занесите в протокол: какие белки из каких организмов Вы выравнивали, проценты идентичности ("Identities") и сходства ("Positives"), число гэпов, координаты выровненного участка (участков, если выдано несколько выравниваний) в обеих последовательностях. Сохраните карту локального сходства в виде gif-файла; желательно, чтобы в имени файла фигурировали идентификаторы последовательностей.
См. указания.

  Если все обязательные задания сделаны, можете приступать к дополнительным заданиям.