Цель задания - cравнить множественное выравнивание, построенное программой ClustalW, с "эталонным" выравниванием из банка выравниваний SMART.
Задание 1:В базе данных SMART получить изображение доменной структуры моего белка. Выбрать один из доменов и получить эталонное выравнивание доменов, гомологичных выбранному. Затем создать фрагмент для дальнейшего детального исследования с толщиной в 5 последовательностей и шириной в 50-80 а. о. Вырезать из эталонного выравнивания с помощью GeneDoc фрагмент для дальнейшего детального исследования. Толщина фрагмента должна быть 5 последовательностей, ширина - 50-80 остатков.
Cами а. о. последовательности белков:
Фрагмент "эталонного" выравнивания из SMART:
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 6 | 0 |   |   |   |   |   |   |   |   |   |   |   |   |
S | Y | H | _ | E | C | O | L | I |   | : |   | I | W | Q | R | I | E | G | T | L | K | N | V | L | G | - | S | Y | G | Y | S | E | I | R | L | P | I | V | E | Q | T | P | L | F | K | R | A | I | G | E | V | T | D | V | V | E | K | E | M | Y | T | F | E | D | R | N | G | - | - | - | - | - | - | - | - | D | S | L |   | : |   | 5 | 8 | |
S | Y | S | _ | A | R | A | T | H |   | : |   | L | N | Q | A | L | I | N | F | G | L | T | F | L | K | K | R | - | G | F | T | G | L | Q | P | P | F | F | M | R | K | D | V | M | A | K | - | C | - | A | Q | L | A | Q | F | D | E | E | L | Y | K | V | T | G | E | G | - | - | - | - | - | - | - | - | - | D | D | K |   | : |   | 5 | 5 | |
S | Y | T | _ | T | H | E | M | A |   | : |   | V | L | N | E | L | M | K | F | S | R | E | L | H | R | - | E | R | G | Y | Q | E | I | F | T | P | L | I | M | N | E | Q | L | W | K | I | - | S | G | H | W | D | H | Y | A | E | N | - | M | Y | F | - | I | E | K | D | E | - | - | - | - | - | - | - | - | E | R | Y |   | : |   | 5 | 5 | |
S | Y | P | _ | M | Y | C | T | U |   | : |   | V | L | R | N | I | E | R | V | I | R | D | E | M | N | A | I | - | G | G | Q | E | I | L | F | P | A | L | L | P | R | A | P | Y | E | T | - | T | N | R | W | T | Q | Y | G | D | S | - | V | F | R | L | K | D | R | R | G | - | - | - | - | - | - | - | - | N | D | Y |   | : |   | 5 | 6 | |
S | Y | G | _ | M | E | T | T | H |   | : |   | L | K | N | K | I | M | N | R | W | R | E | F | Y | V | V | R | E | G | F | Y | E | I | E | S | P | T | I | M | P | E | E | A | L | K | A | - | S | G | H | V | D | H | F | N | D | P | - | M | T | Q | C | K | E | C | M | D | V | Y | R | A | D | H | I | I | E | - | - |   | : |   | 6 | 3 | |
  |   |   |   |   |   |   |   |   |   |   |   |   | 6 |   |   |   | 6 |   |   |   |   |   |   |   |   |   |   |   |   | G |   |   | e | 6 |   |   | P |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | 6 |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
Cамо "эталонное" выравнивание представлено в файле benchmark.msf
Задание 2: по идентификаторам UniProt из benchmark.msf получить с помощью SRS полные последовательности в формате Fasta, построить программой ClustalW множественное выравнивание последовательностей из full_seq.fasta программой emma пакета EMBOSS.
Фрагмент полного множественного выравнивания, полученного с помощью программы ClustalW:
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 0 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 6 | 0 |   |   |   |   |   |   |   |   |   |   |
S | Y | H | _ | E | C | O | L | I |   | : |   | A | I | R | G | M | N | D | Y | L | P | G | E | T | A | I | W | Q | R | I | E | G | T | L | K | N | V | L | G | S | Y | G | Y | S | E | I | R | L | P | I | V | E | Q | T | P | L | F | K | R | A | I | G | E | V | T | D | V | V | E | K | E | M | Y | T | F | E | D | R | N | G | D | S | L | T | L | R | P | E | G | T | A | G | C |   | : |   |   | 8 | 8 |
S | Y | S | _ | A | R | A | T | H |   | : |   | R | R | F | A | S | V | E | I | V | D | E | I | I | K | L | D | K | E | W | R | Q | R | Q | F | E | V | D | S | F | R | K | E | F | N | K | L | N | K | Q | V | A | Q | L | K | I | K | K | E | D | A | S | E | I | I | Q | Q | T | E | K | N | K | Q | D | S | T | A | K | E | A | E | V | R | E | A | Y | A | A | L | K | A | K | L |   | : |   | 1 | 0 | 5 |
S | Y | T | _ | T | H | E | M | A |   | : |   | R | L | Y | G | K | E | N | V | K | L | G | I | G | P | T | I | E | N | G | F | Y | Y | D | F | D | I | K | N | G | R | L | T | E | E | D | L | P | K | I | E | Q | E | M | K | K | I | I | K | E | N | L | P | I | E | R | K | E | I | S | K | E | E | A | R | E | L | F | R | D | Q | P | Y | K | L | E | L | I | E | E | I | E | G |   | : |   | 1 | 6 | 4 |
S | Y | P | _ | M | Y | C | T | U |   | : |   | V | A | P | G | L | Y | S | W | L | P | L | G | L | R | V | L | R | N | I | E | R | V | I | R | D | E | M | N | A | I | G | G | Q | E | I | L | F | P | A | L | L | P | R | A | P | Y | E | T | T | N | R | W | T | Q | Y | G | D | S | V | F | R | L | K | D | R | R | G | N | D | Y | L | L | G | P | T | H | E | E | L | F | T | L |   | : |   | 1 | 1 | 8 |
S | Y | G | _ | M | E | T | T | H |   | : |   | S | S | F | E | I | Y | S | G | V | A | G | F | V | D | Y | G | P | L | G | A | T | L | K | N | K | I | M | N | R | W | R | E | F | Y | V | V | R | E | G | F | Y | E | I | E | S | P | T | I | M | P | E | E | A | L | K | A | S | G | H | V | D | H | F | N | D | P | M | T | Q | C | K | E | C | M | D | V | Y | R | A | D | H | I |   | : |   | 1 | 0 | 2 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 8 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 0 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 4 | 0 |   |   |   |   |   |   |   |   |   |   |   |   |
S | Y | H | _ | E | C | O | L | I |   | : |   | V | R | A | G | I | E | H | G | L | L | Y | N | Q | E | Q | R | L | W | Y | I | G | P | M | F | R | H | E | R | P | Q | K | G | R | Y | R | Q | F | H | Q | L | G | C | E | V | F | G | L | Q | G | P | D | I | D | A | E | L | I | M | L | T | A | R | W | W | R | A | L | G | I | S | E | H | V | T | L | E | L | N | S | I | G | S |   | : |   | 1 | 7 | 0 |
S | Y | S | _ | A | R | A | T | H |   | : |   | E | Q | V | G | N | L | V | H | D | S | V | P | V | D | K | D | E | A | N | N | L | V | I | K | L | W | G | E | K | R | F | S | T | P | G | L | K | L | K | N | H | V | D | L | V | E | L | L | G | I | A | D | T | K | R | G | A | E | I | A | G | A | R | G | F | F | L | K | G | D | G | L | M | L | N | Q | A | L | I | N | F | G |   | : |   | 1 | 8 | 7 |
S | Y | T | _ | T | H | E | M | A |   | : |   | N | R | V | T | I | Y | R | Q | G | E | F | V | D | L | C | R | G | P | H | L | P | S | T | G | I | V | K | H | F | K | L | L | S | V | S | G | A | Y | W | R | G | S | E | K | N | P | M | L | T | R | V | Y | G | T | A | F | A | K | K | E | D | L | D | N | Y | L | K | F | L | E | E | A | Q | R | R | D | H | R | K | L | G | P |   | : |   | 2 | 4 | 6 |
S | Y | P | _ | M | Y | C | T | U |   | : |   | T | V | K | G | E | Y | S | S | Y | K | D | F | P | L | T | L | Y | Q | I | Q | T | K | Y | R | D | E | A | R | P | R | A | G | I | L | R | A | R | E | F | V | M | K | D | S | Y | S | F | D | I | D | A | A | G | L | K | A | A | Y | H | A | H | R | E | A | Y | Q | R | I | F | D | R | L | Q | V | R | Y | V | I | V | S | A | V |   | : |   | 2 | 0 | 0 |
S | Y | G | _ | M | E | T | T | H |   | : |   | I | E | D | A | T | G | R | D | V | E | G | L | E | N | Q | E | L | T | E | I | I | S | D | E | G | I | R | C | P | R | C | G | G | H | L | T | H | V | W | S | Y | N | L | M | F | Q | T | L | I | G | A | R | G | K | K | T | G | Y | L | R | P | E | T | A | Q | G | I | F | I | P | F | K | R | L | L | R | F | F | R | N | R | L |   | : |   | 1 | 8 | 4 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 6 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 2 | 8 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 3 | 0 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 3 | 2 | 0 |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
S | Y | H | _ | E | C | O | L | I |   | : |   | L | E | A | R | A | N | Y | R | D | A | L | V | A | F | L | E | Q | H | K | E | K | L | D | E | D | C | K | R | R | M | Y | T | N | P | L | R | V | L | D | S | K | N | P | E | V | Q | A | L | L | N | D | A | P | A | L | G | D | Y | L | D | E | E | S | R | E | H | F | A | G | L | C | K | L | L | E | S | A | G | I | A | Y | T |   | : |   | 2 | 5 | 2 |
S | Y | S | _ | A | R | A | T | H |   | : |   | L | T | F | L | K | K | R | G | F | T | G | L | Q | P | P | F | F | M | R | K | D | V | M | A | K | C | A | Q | L | A | Q | F | D | E | E | L | Y | K | V | T | G | E | G | D | D | K | Y | L | I | A | T | A | E | Q | P | L | C | A | Y | H | I | D | E | W | I | H | P | T | E | L | P | L | R | Y | A | G | Y | S | S | C | F | R |   | : |   | 2 | 6 | 9 |
S | Y | T | _ | T | H | E | M | A |   | : |   | Q | L | E | L | F | M | L | N | T | E | Y | A | P | G | M | P | F | F | L | P | K | G | V | V | V | L | N | E | L | M | K | F | S | R | E | L | H | R | E | R | G | Y | Q | E | I | F | T | P | L | I | M | N | E | Q | L | W | K | I | S | G | H | W | D | H | Y | A | E | N | M | Y | F | I | E | K | D | E | E | R | Y | A | V | K |   | : |   | 3 | 2 | 8 |
S | Y | P | _ | M | Y | C | T | U |   | : |   | S | G | A | M | G | G | S | A | S | E | E | F | L | A | E | S | P | S | G | E | D | A | F | V | R | C | L | E | S | G | Y | A | A | N | V | E | A | V | V | T | A | R | P | D | T | L | P | I | D | G | L | P | E | A | V | V | H | D | T | G | D | T | P | T | I | A | S | L | V | A | W | A | N | E | A | D | L | G | R | T | V | T |   | : |   | 2 | 8 | 2 |
S | Y | G | _ | M | E | T | T | H |   | : |   | P | F | G | V | V | Q | L | G | K | S | Y | R | N | E | I | S | P | R | Q | G | V | I | R | L | R | E | F | T | Q | A | E | A | E | I | F | V | D | P | E | H | K | T | H | P | D | F | E | E | V | K | E | D | I | L | R | L | Y | P | A | G | R | Q | M | E | E | S | G | T | V | D | M | T | A | A | E | A | L | E | A | G | V | I |   | : |   | 2 | 6 | 6 |
  |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
Дополнительное задание 3: Получить матрицу попарного совпадения последовательностей.
В таблицах указаны проценты идентичности последовательностей. Выравнивание в первом случае глобальное, поэтому 4% идентичности нас не должны удивить. Здесь выравнивание не одного домена, то есть в белках, вне сомнения, есть много непохожих участков. Смартовское выравнивание лучше.
На главную страницу семестра |