Поиск по паттерну в банке Swiss-Prot.
* С помощью программы blastp
(на сервере NCBI, ведь NCBI позволяет получить сразу несколько последовательностей в формате FASTA...)
в банке Swiss-Prot найдены гомологи ASPG2_ECOLI; из них выбраны 4 ортолога: ASPG2_BACSU, ASPG2_HAEIN, ASPG2_SCHPO,
ASPG2_YEAST - в дальнейшем такую выборку я буду именовать "вспомогательным" вариантом. Критерии отбора:
совпадение названий белков из разных организмов
и процент идентичности (40-80%) - это было указано в задании. В полученной выборке процент идентичности составляет от
39% до 68% (ASPG2_BACSU - 53%, ASPG2_HAEIN - 68%, ASPG2_SCHPO - 39%, ASPG2_YEAST - 40%)
Последовательности найденных белков плюс последовательность ASPG2_ECOLI можно увидеть здесь.
** Еще вариант (основной) - я выбрала последовательности других белков
(как 4х наиболее вероятных ортологов): ASPG2_BACSU, ASPG2_HAEIN,ASPG_HELPY,
ASPG_WOLSU. Критерием отбора стал процент идентичности в диапазоне 47-68% (в частности, ASPG2_BACSU - 53%; ASPG2_HAEIN - 68%;
ASPG_HELPY - 47%; ASPG_WOLSU - 53%). E-value находoк - наилучшие ( небольшое "отступление" от этого принципа
в случае с ASPG_HELPY: можно было бы рассмотереть ASPG_HELPJ, для которого значение
E-value ниже, чем у ASPG_HELPY (следовательно, лучше...), однако "любопытства ради" был отобран "кандидат" с
меньшим процентом идентичности).
Последовательности найденных белков плюс последовательность ASPG2_ECOLI можно увидеть здесь.
А есть ли смысл приводить 2 варианта?.. Думаю, да. А объяснение такое: при составлении паттернов интересно будет сравнить 2 множественных выравнивания, консервативные аминокислотные остатки,соответствующие замены а.о... Переходим непосредственно к выравниваниям:
Проведен поиск последовательностей банка Swiss-Prot (online - через БД PROSITE: раздел "Tools for PROSITE", далее - переход по гиперссылке "ScanProsite",
затем ввод паттерна в правом окне, кнопка START THE SCAN - получаем результат), включающих
мотивы, соответствующие каждому из полученных паттернов.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
*
 
 
 
 
 
 
 
 
 
 
 
A
S
P
G
2
_
E
C
O
L
 
:
 
G
R
D
V
T
K
T
N
T
T
D
V
A
T
F
K
 
:
 
1
6
A
S
P
G
2
_
B
A
C
S
 
:
 
A
R
Y
V
T
K
T
N
T
T
T
T
D
T
F
K
 
:
 
1
6
A
S
P
G
2
_
H
A
E
I
 
:
 
A
R
D
V
T
K
T
S
T
T
A
V
Q
T
F
H
 
:
 
1
6
A
S
P
G
_
H
E
L
P
Y
 
:
 
A
R
E
V
I
K
T
H
T
T
H
T
S
T
F
K
 
:
 
1
6
A
S
P
G
_
W
O
L
S
U
 
:
 
A
R
E
A
T
K
L
N
T
T
A
V
N
A
F
A
 
:
 
1
6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
R
 
 
 
K
 
 
T
T
 
 
 
 
F
 
 
 
 
 
 
Поиск по паттерну в банке Swiss-Prot.
Характеристика паттерна
Паттерн
В скольких последовательностях банка Swiss-Prot
найден мотив, удовлетворяющий паттерну?
Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности
GRDVTKTNTTDVATFK
1
Нет, только последовательность ASPG2_ECOLI
Сильный***
[GA]-R-[DYE]-[VA]-[TI]-K-[TL]-[NSH]-TT-[DTAH]-[VT]-[ADQSN]-[TA]-F-[KHA]
([GA]-R-[DYE]-[VA]-[TI]-K-[TL]-[NSH]-TT-X(4)-F-[KHA])5
Да
Слабый
R-{GA}-[VA]-[TI]-K-[TL]-[NSH]-T-X(5)-F
5
Да
Наблюдения и размышления:
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   |   |   |   |   |
A | S | P | G | 2 | _ | E | C | O | L |   | : |   | G | R | D | V | T | K | T | N | T | T | D | V | A | T | F | K |   | : |   |   | 1 | 6 |
A | S | P | G | 2 | _ | B | A | C | S |   | : |   | A | R | Y | V | T | K | T | N | T | T | T | T | D | T | F | K |   | : |   |   | 1 | 6 |
A | S | P | G | 2 | _ | H | A | E | I |   | : |   | A | R | D | V | T | K | T | S | T | T | A | V | Q | T | F | H |   | : |   |   | 1 | 6 |
A | S | P | G | 2 | _ | S | C | H | P |   | : |   | A | F | Y | T | T | K | T | N | G | N | T | L | D | T | F | K |   | : |   |   | 1 | 6 |
A | S | P | G | 2 | _ | Y | E | A | S |   | : |   | G | F | W | T | T | K | M | N | A | N | S | L | D | T | F | R |   | : |   |   | 1 | 6 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | T | K |   |   |   |   |   |   |   | T | F |   |   |   |   |   |   |   |
"Общие-неизменные" (с "основным" фрагментом выравнивания) аминокислотные остатки: лизин - в 6 позиции, фенилаланин - в 15й.
Задача вполне конкретная: создать такой паттерн, чтоб по результатам поиска выдавались, соответственно, только
последовательности белков из обоих выравниваний. В результате "хитроумных деяний" - преобразований "слабого" паттерна (собственно, занятие для "растяжки мозгов")
получился: [GA]-[RF]-{I}-X-[TI]-K-X(3)-[TN]-X(3)-[TA]-F-X.
В результате, в 10 последовательностях банка Swiss-Prot найден заданный мотив.7 из них - "то, что надо"; а оставшиеся 3 -
белки ASPG1_SCHPO, ASPG3_SCHPO, ASPG4_SCHPО (предшественники L-аспарагиназ 1, 3,4...)."Убрать" из выборки, преобразовывав паттерн
[GA]-[RF]-{I}-X-[TI]-K-X(3)-[TN]-X(3)-[TA]-F-X на рассматриваемом участке (в 16 а.о.), можно только ASPG1_SCHPO и ASPG3_SCHPO.
Для этого участок [TN]-X(3)-[TA] заменяю на [TN]-{M}-X(2)-[TA]. Тогда получаю паттерн
вида [GA]-[RF]-{I}-X-[TI]-K-X(3)-[TN]-{M}-X(2)-[TA]-F-X - это и есть ответ на задачу.
А исключить ASPG4_SCHPО из результатов поиска таким способом не получится: у ASPG2_SCHPО и ASPG4_SCHPО паттерном задаются абсолютно
идентичные участки вида AFYtTKtngNtldTFk - изменения в паттерне могут привести к исчезновению не только ASPG4_SCHPО, но и ASPG2_SCHPО
из результатов поиска.