Множественные выравнивания
Целью занятия было сравнение двух множественных выравниваний…
Построение эталонного выравнивания
С помощью базы данных
SMART я нашёл эталонные выравнивания для своего белка. Т.к. для него был найден только один домен, выравнивание осуществлялось по нему и было сохранено в файле
Peripla_BP_2.msf, по названию домена.
Фрагмент для далнейшего исследования
Из этого файла я вырезал с помощью программы
GeneDoc фрагмент для дальнейшего исследования, сохранённый в файле
benchmark.msf. Длинной 59 остатков, это непрерывное выравнивание из 5 последовательностей выглядело довольно удачным.
Полные последовательности в формате Fasta
Я получил оставленные мною последовательности целиком с помощью
SRS, в
fasta-файле
full_seq.fasta. С этим методом я уже был знаком.
Полное выравнивание последовательностей
Я построил выравнивание этих последовательностей и сохранил результат в
fasta-файле
crustalw.aln, после чего импортировал в
crustalw.msf.
Сравнение полученных выравниваний
Таким образом, я получил на руки два выравнивания. Вырезав из второго тот же фрагмент в файл
crustalw_frag.msf, я сравнил их вручную. Как видно на
Табл. 1, выравнивания почти не совпадают; если быть точным, одинаковы лишь 9 из 59 столбцов файла
benchmark.msf, значит, мера сходства – 15,2%.
Таблица 1. Сравнение полученных последовательностей.
|   |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
|   |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
2 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
4 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
6 |
0 |
  |
  |
  |
  |
  |
  |
  |
| O |
5 |
9 |
3 |
4 |
2 |
_ |
P |
Y |
R |
  |
: |
  |
V |
T |
I |
E |
K |
E |
P |
Q |
R |
I |
V |
S |
L |
A |
P |
S |
I |
T |
E |
T |
L |
Y |
F |
I |
G |
A |
L |
D |
K |
V |
V |
G |
V |
T |
K |
F |
D |
D |
F |
P |
P |
G |
V |
K |
K |
G |
R |
T |
I |
I |
G |
D |
F |
S |
N |
P |
N |
I |
E |
V |
I |
A |
  |
: |
  |
6 |
2 |
| O |
3 |
4 |
8 |
0 |
5 |
_ |
B |
A |
C |
  |
: |
  |
V |
T |
I |
K |
K |
E |
P |
K |
K |
I |
V |
S |
L |
M |
P |
S |
N |
T |
E |
I |
T |
Y |
A |
L |
G |
L |
G |
D |
K |
V |
V |
G |
V |
T |
T |
N |
D |
T |
Y |
P |
K |
E |
V |
K |
K |
V |
E |
K |
V |
G |
- |
- |
D |
M |
N |
V |
N |
V |
E |
K |
V |
I |
  |
: |
  |
6 |
0 |
| B |
T |
U |
F |
_ |
E |
C |
O |
L |
I |
  |
: |
  |
L |
W |
L |
N |
A |
A |
P |
- |
R |
V |
I |
T |
L |
S |
P |
A |
N |
T |
E |
L |
A |
F |
A |
A |
G |
I |
T |
P |
- |
- |
V |
G |
V |
S |
S |
Y |
S |
D |
Y |
P |
P |
Q |
A |
Q |
K |
I |
E |
Q |
V |
S |
- |
T |
W |
Q |
G |
M |
N |
L |
E |
R |
I |
V |
  |
: |
  |
5 |
8 |
| Q |
4 |
8 |
9 |
3 |
9 |
_ |
M |
E |
T |
  |
: |
  |
T |
I |
G |
T |
S |
S |
P |
S |
A |
I |
L |
V |
Y |
M |
L |
A |
P |
D |
K |
L |
A |
G |
W |
N |
S |
K |
Q |
N |
F |
T |
Q |
P |
F |
M |
D |
E |
N |
Y |
S |
N |
L |
P |
V |
I |
G |
N |
W |
L |
G |
S |
- |
- |
- |
K |
T |
G |
N |
Y |
E |
T |
V |
I |
  |
: |
  |
5 |
9 |
| Y |
8 |
7 |
2 |
_ |
M |
E |
T |
J |
A |
  |
: |
  |
I |
V |
T |
D |
F |
Y |
C |
P |
I |
I |
S |
A |
A |
D |
I |
L |
N |
A |
Y |
H |
H |
T |
I |
V |
G |
A |
P |
K |
Y |
A |
V |
E |
K |
S |
P |
K |
L |
K |
E |
L |
F |
D |
E |
G |
K |
V |
V |
D |
I |
G |
S |
P |
S |
K |
G |
V |
N |
Y |
E |
L |
I |
V |
  |
: |
  |
6 |
2 |
|   |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
p |
  |
  |
6 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
g |
  |
  |
  |
  |
  |
v |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
k |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
N |
  |
E |
  |
6 |
  |
  |
  |
  |
  |
  |
|   |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
|   |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
2 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
4 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
* |
  |
  |
  |
  |
  |
  |
  |
  |
6 |
0 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
| O |
5 |
9 |
3 |
4 |
2 |
_ |
P |
Y |
R |
  |
: |
  |
Q |
R |
I |
V |
S |
L |
A |
P |
S |
I |
T |
E |
T |
L |
Y |
F |
I |
G |
A |
L |
D |
K |
V |
V |
G |
V |
T |
- |
K |
F |
D |
D |
F |
P |
P |
G |
V |
K |
K |
G |
R |
T |
I |
I |
G |
- |
- |
- |
D |
F |
S |
N |
P |
N |
I |
E |
V |
I |
A |
- |
- |
- |
- |
- |
- |
- |
  |
: |
  |
5 |
5 |
| O |
3 |
4 |
8 |
0 |
5 |
_ |
B |
A |
C |
  |
: |
  |
K |
K |
I |
V |
S |
L |
M |
P |
S |
N |
T |
E |
I |
T |
Y |
A |
L |
G |
L |
G |
D |
K |
V |
V |
G |
V |
T |
- |
- |
T |
N |
D |
T |
Y |
P |
K |
E |
V |
K |
K |
V |
E |
K |
V |
G |
- |
- |
- |
- |
D |
M |
N |
V |
N |
V |
E |
K |
V |
I |
- |
- |
- |
- |
- |
- |
- |
  |
: |
  |
5 |
3 |
| B |
T |
U |
F |
_ |
E |
C |
O |
L |
I |
  |
: |
  |
- |
R |
V |
I |
T |
L |
S |
P |
A |
N |
T |
E |
L |
A |
F |
A |
A |
G |
I |
T |
P |
V |
G |
V |
S |
S |
Y |
- |
- |
- |
- |
S |
D |
Y |
P |
P |
Q |
A |
Q |
K |
I |
E |
Q |
V |
S |
- |
- |
- |
T |
W |
Q |
G |
M |
N |
L |
E |
R |
I |
V |
- |
- |
- |
- |
- |
- |
- |
  |
: |
  |
5 |
1 |
| Q |
4 |
8 |
9 |
3 |
9 |
_ |
M |
E |
T |
  |
: |
  |
T |
I |
G |
T |
S |
S |
P |
S |
A |
I |
L |
V |
Y |
M |
L |
A |
P |
D |
K |
L |
A |
G |
W |
N |
S |
K |
Q |
N |
F |
T |
Q |
P |
F |
M |
D |
E |
N |
Y |
S |
N |
L |
P |
V |
I |
G |
N |
W |
L |
G |
S |
K |
T |
G |
N |
Y |
E |
T |
V |
I |
- |
- |
- |
- |
- |
- |
- |
  |
: |
  |
5 |
9 |
| Y |
8 |
7 |
2 |
_ |
M |
E |
T |
J |
A |
  |
: |
  |
- |
- |
I |
I |
S |
A |
A |
D |
I |
L |
N |
A |
Y |
H |
H |
T |
I |
V |
G |
A |
P |
K |
Y |
A |
V |
E |
K |
S |
P |
K |
L |
K |
E |
L |
F |
D |
E |
G |
K |
- |
V |
V |
D |
I |
G |
S |
- |
- |
P |
S |
K |
G |
V |
N |
Y |
E |
L |
I |
V |
- |
- |
- |
- |
- |
- |
- |
  |
: |
  |
5 |
4 |
|   |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
3 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
6 |
g |
  |
  |
  |
  |
  |
  |
  |
  |
N |
  |
E |
  |
6 |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |
  |