Учебный сайт Ксении Березиной

Работа с BLAST

Задание 1

Необходимо найти гомологов последовательности гипотетического белка A.pernix с идентификатором в Refseq NP_147299.2. Для этого можно воспользоваться сервисом Blast (Blastp).

На рисунке 1 можно увидеть выходную таблицу с результатами поиска.

Рис. 1. Часть выходной таблицы, полученной с помощью Blastp. Выбранная находка выделена цветом.

Разъясню названия столбцов:

Кроме того, можно посмотреть на выравнивание с выбранным белком-гомологом археи Acidilobus sp. (рис. 2). Выровнен один участок сходства (Number of matches: 1).

Рис 2. Выравнивание входного белка и WP_023424488.1.

Задание 2

Используя Blast, выровняем исходный белок NP_147299.2 и выбранный WP_023424488.1. Получили карту локального сходства (рис. 3). На оси абсцисс представлены номера аминокислотных остатков входного белка, на оси ординат — белка WP_023424488.1. Соответственно линия указывает на сходство остатков.

Рис 3. Карта локального сходства (Dot Matrix View) белков NP_147299.2 и WP_023424488.1.

Оба организма, из которых выделены белки, относятся к классу термофильных архей Thermoprotei. Но они принадлежат разным порядкам: Acidilobus sp.к Acidilobales (населяют кислые среды, богатые серой), а A.pernix — к Desulfurococcales (коккоидные формы). Кроме того оба белка предположительно отвечают за связывание РНК[1].

Длина второго белка меньше более чем в два раза. По карте выравнивания можно увидеть, что совпадение аминокислот равномерное по длинам обеих последовательностей, нет повторяющихся участков. Судя по общему происхождению организмов, все-таки можно говорить гомологичности этих белков.

Задание 3, 4

С помощью Blast найдено 25 белков эукариот со сходной структурой (рис. 4). Если гомологичными считать последовательности, E-value которых < 0.001, то найдено 16 белков-гомологов. Среди них есть белки, например, крысы и гриба-сахаромицета. Все же процент сходства (Ident) и E-value значительно хуже, чем в первом поиске, то есть достоверность общего происхождения невысокая.

Рис. 4. Часть выходной таблицы с лучшими находками-гомологами среди эукариот.

Данные по множественному выравниванию первых семи белков:

Было взято только семь белков из 16ти, чтобы были консервативные колонки в выравнивании. Данные получены с помощью программы infoalign.

Рис. 5. Часть множественного выравнивания семи белков-гомологов NP_147299.2 эукариот (identity threshold above 70)

Источники:

[1]"Predicted RNA-binding protein" http://www.ncbi.nlm.nih.gov/protein/118431091?report=genbank&log$=prottop&blast_rank=1&RID=REHWY90U01R; http://www.ncbi.nlm.nih.gov/protein/557422408?report=genbank&log$=prottop&blast_rank=5&RID=REHWY90U01R

Назад к второму семестру