УЧЕБНЫЙ САЙТ АМОСОВОЙ АЛЁНЫ

BLAST.

1.Поиск гомологов последовательности белка grl4197 в банке Uniprot/SwissProt

Во время этого практикума мы занимались поиском по сходству последовательностей гомологов белка. Поиск проводился в базе данных Uniprot/SwissProt. Информация о найденных последовательностях появляется в нескольких столбцах:
Description – название белка и ссылка на него.
Max score - это, вероятно, наибольший вес одного из участков выравнивания
Total score - общий вес выравнивания
Query cover (покрытие) - показывает, какой процент последовательности выравнен с последовательностью из запроса
E-value - Среднее число находок по даному запросу с таким же или лучшим весом в банке случайных последовательностей
Ident – процент совпадающих позиций
Accession - идентифакационный код последовательностей. Нажав на него, можно попасть на страничку с описанием этого белка в NCBI Protein Database.
Согласуясь с условиями в задании, я выбрала один белок. Его характеристики можно посмотреть на Рисунке 1.


Рис.1. Характеристики находки.

Более подробная информация – на Рисунке 2.


Рис.2. Расширенные характеристики находки.

Как можно видеть из Рисунка 2, выравнивание идет с 52 по 317 аминокислоты исходной последовательности и с 44 по 330 аминокислоты находки. Также на Рисунке 3 приведены параметры лучшей находки


Рис.3. Характеристики лучшей находки.


2.Карта локального сходства

Карты локального сходства используются для визуализации выравнивания. По оси Х откладываются координаты исходной последовательности(query), по оси У – координаты находки. Карта представлена на Рисунке 4. Как можно заметить, в выравнивании довольно много гэпов как в исходной последовательности (когда не изменяется координата конца одной и начала другой линии по оси Х) и в последовательности-находке. Не смотря на множество разрывов, выравнивание хорошее и скорее всего на нем нет сходных но не гомологичных участков.


Рис.4. Карта локального сходства.

3.Эукариотические гомологи последовательности.

Среди сходных последовательностей довольно много белков эукариот – 218. Однако, если считать гомологами те последовательности, которые сходны с данной с E-value < 0.001, то их количество сократится до 206.

4.Множественное выравнивание.

Из найденных в четвертом задании последовательностей было выбрано 6, и составлено выравнивание, fasta-файл которого можно скачать ЗДЕСЬ . На Рисунке 5 представлена визуализация этого выравнивания с помощью программы Jalview (Clustalx, By conservation 70%).



Рис.5. Полное выравнивание.


© Амосова Алена. 2014 год