Создание паттернов для поиска и распознавания аминокислотных
последовательностей |
Упражнение 1. Создать множественное выравнивание последовательности белка
и 5-ти его гипотетических ортологов |
С помощью программы blastp в банке Swiss-Prot были найдены предпологаемые
гомологи белка EX5B_ECOLI, и были выбраны 4 более вероятных ортологов,
с процентом идентичности менее 80%, а E-value не хуже 0.001.
Далее был получен файл с последовательностями самого белка и его
ортологов в формате FASTA (sequenses.fasta)
С помощью программы muscle построено множественное выравнивание белка EX5B_ECOLI
и его ортологов. Результаты импортированы в GeneDoc и сохранены в файл
Gene1.msf.
Затем был выбран консервативный фрагмент выравнивания длиной 9 а.о. и экспортирован
в файл Gene2.html: |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
E |
X |
5 |
B |
_ |
E |
C |
O |
L |
I |
  |
: |
  |
L |
Y |
L |
R |
L |
L |
L |
G |
L |
  |
: |
  |
  |
9 |
E |
X |
5 |
B |
_ |
B |
U |
C |
A |
I |
  |
: |
  |
V |
L |
L |
Y |
L |
R |
L |
L |
L |
  |
: |
  |
  |
9 |
E |
X |
5 |
B |
_ |
B |
U |
C |
A |
P |
  |
: |
  |
L |
I |
E |
A |
S |
A |
G |
T |
G |
  |
: |
  |
  |
9 |
E |
X |
5 |
B |
_ |
H |
A |
E |
I |
N |
  |
: |
  |
Y |
L |
R |
L |
L |
L |
K |
A |
G |
  |
: |
  |
  |
9 |
E |
X |
5 |
B |
_ |
B |
U |
C |
B |
P |
  |
: |
  |
I |
L |
Y |
I |
R |
L |
L |
L |
G |
  |
: |
  |
  |
9 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
Таблица: Результаты использования
различных паттернов при поиске в банке данных Swiss-Prot
Характеристика паттерна |
Фрагмент последовательности |
Сильный |
Слабый |
Паттерн |
LYLRLLLGL |
L-[LI]-[LERY]-[AILY]-[LSR]-[LRA]-[LGK]-[LTA]-[LG] |
L-[LI]-[LERY]-X-[LSR]-[LAR] |
В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? |
2 |
297 |
1000 |
Все ли последовательности из Вашего выравнивания найдены? |
нет |
да |
да |
|
Первый паттерн является фрагментом последовательности белка EX5B_ECOLI. Второй
паттерн ("сильный") построен так, что в нем указываются все возможные варианты аминокислотных
остатков в каждой из позиций. Но помимо необходимых последовательностей были найдены и другие,
которые нас совсем не интересовали. Третий паттерн ("слабый") построен на основе второго,
но требования к последовательности сделаны более мягкими. |