Blast. Поиск гомологов и выравнивания

Поиск гомологов последовательности YP_209034.1 в банке Uniprot/SwissProt

Исходной последовательностью в данном задании служит ABC-транспортерный периплазматический связывающий аминокислоты белок. Для него были найдены гомологи при помощи алгоритма protein blast (blasp).

В результате было получено множество белков, чьи последовательности в разной степени гомологичны исходной. Для описания я выбрала первый белок из найденных. В таблице 1 представлены параметры сходства этого белка с исходным.

Таблица 1. Найденный гомолог ABC-транспортерного периплазматического связывающего аминокислоты белка
Description Max score Total score Query cover E value Ident Accession
RecName: Full=ABC transporter glutamine-binding protein GlnH; Flags: Precursor 146 146 90% 3e-40 35% O34563.1

Следует расшифровать обозначения в таблице 1.

  • Description - название белка
  • Max score - наибольший вес одного из участков выравнивания
  • Total score - общий вес выравнивания, обычно не отличается от Max score, за исключением случая, когда выровнялось два и более участка
  • Query cover - сколько % от исходной последовательности вошло в выравнивание
  • E value - математическое ожидание выравнивания с таким же весом и более в банке случайных последовательностей того же размера, что и данный (аминокислотный состав и длины всех последовательностей таком банке совпадают с данным)
  • Ident - процент совпадающих аминокислот
  • Accession - идентифакационный код белка

82% найденного белка участвует в выравнивании с исходным. Это можно определить, выполнив поиск в обратную сторону.

Выравнивание исходного белка с найденным представлено по ссылке.

Карта локального сходства

На рис.1. показана карта локального сходства ABC-транспортерного периплазматического связывающего аминокислоты белка и найденного гомолога.


Рис.1. Карта локальго сходства

Как видно из рис.1, последовательности почти полностью гомологичны на протяжении всего выравнивания. Имеется 4 точки разрыва линии на карте, а значит всего 4 предположтельные делеции или вставки, где в выравнивании присутствуют гэпы.

Поиск гомологов у других групп организмов

Для поиска гомологичных белков в надцарстве эукариот соотвествующая группа организмов была вписана в поле Organism в окне запуска Blast. Однако, гомологичных белков у эукариот не нашлось, так как максимальное E-value, допустимое для гомологов равно 0.001, а у найденных белков оно было больше 0.006

Поиск был проведен в родственном исходному организму Neisseria gonorrhoedae классе γ-протеобактерий.

Нашлось 27 белков, подходящих по значению E-value.

Из 10 последовательностей, наиболее вероятно обладающих гомологией с исходной последовательностью, было построено выравнивание при помощи сервиса на сайте NCBI. В формате FASTA на него можно посмотреть здесь, в формате проетка JAR - здесь.

Процент абсолютно консервативных колонок равен 1.06% (6 колонок из 568), функционально консервативных - 5.1% (29 из 568 колонок).

© Маслова Валентина, 2014
Последнее изменение: 05.05.2014