BLAST.
1.Поиск гомологов последовательности белка grl4197 в банке Uniprot/SwissProt
Во время этого практикума мы занимались поиском по сходству последовательностей гомологов белка.
Поиск проводился в базе данных Uniprot/SwissProt. Информация о найденных последовательностях появляется в нескольких столбцах:
Description – название белка и ссылка на него.
Max score - это, вероятно, наибольший вес одного из участков выравнивания
Total score - общий вес выравнивания
Query cover (покрытие) - показывает, какой процент последовательности выравнен с последовательностью из запроса
E-value - Среднее число находок по даному запросу с таким же или лучшим весом в банке случайных последовательностей
Ident – процент совпадающих позиций
Accession - идентифакационный код последовательностей. Нажав на него, можно попасть на страничку с описанием этого белка в NCBI Protein Database.
Согласуясь с условиями в задании, я выбрала один белок. Его характеристики можно посмотреть на Рисунке 1.
Рис.1. Характеристики находки.
Более подробная информация – на Рисунке 2.
Рис.2. Расширенные характеристики находки.
Как можно видеть из Рисунка 2, выравнивание идет с 52 по 317 аминокислоты исходной последовательности и с 44 по 330 аминокислоты находки.
Также на Рисунке 3 приведены параметры лучшей находки
Рис.3. Характеристики лучшей находки.
2.Карта локального сходства
Карты локального сходства используются для визуализации выравнивания. По оси Х откладываются координаты исходной
последовательности(query), по оси У – координаты находки.
Карта представлена на Рисунке 4. Как можно заметить, в выравнивании довольно много гэпов как в исходной последовательности
(когда не изменяется координата конца одной и начала другой линии по оси Х) и в последовательности-находке. Не смотря на множество разрывов,
выравнивание хорошее и скорее всего на нем нет сходных но не гомологичных участков.
Рис.4. Карта локального сходства.
3.Эукариотические гомологи последовательности.
Среди сходных последовательностей довольно много белков эукариот – 218. Однако, если считать гомологами
те последовательности, которые сходны с данной с E-value < 0.001, то их количество сократится до 206.
4.Множественное выравнивание.
Из найденных в четвертом задании последовательностей было выбрано 6, и составлено выравнивание,
fasta-файл которого можно скачать
ЗДЕСЬ .
На Рисунке 5 представлена визуализация этого выравнивания с помощью программы Jalview (Clustalx, By conservation 70%).
Рис.5. Полное выравнивание.
© Амосова Алена. 2014 год |
Дата последнего изменения: 13 марта 2014. |