Множественные выравнивания

Целью занятия было сравнение двух множественных выравниваний…

Построение эталонного выравнивания

С помощью базы данных SMART я нашёл эталонные выравнивания для своего белка. Т.к. для него был найден только один домен, выравнивание осуществлялось по нему и было сохранено в файле Peripla_BP_2.msf, по названию домена.

Фрагмент для далнейшего исследования

Из этого файла я вырезал с помощью программы GeneDoc фрагмент для дальнейшего исследования, сохранённый в файле benchmark.msf. Длинной 59 остатков, это непрерывное выравнивание из 5 последовательностей выглядело довольно удачным.

Полные последовательности в формате Fasta

Я получил оставленные мною последовательности целиком с помощью SRS, в fasta-файле full_seq.fasta. С этим методом я уже был знаком.

Полное выравнивание последовательностей

Я построил выравнивание этих последовательностей и сохранил результат в fasta-файле crustalw.aln, после чего импортировал в crustalw.msf.

Сравнение полученных выравниваний

Таким образом, я получил на руки два выравнивания. Вырезав из второго тот же фрагмент в файл crustalw_frag.msf, я сравнил их вручную. Как видно на Табл. 1, выравнивания почти не совпадают; если быть точным, одинаковы лишь 9 из 59 столбцов файла benchmark.msf, значит, мера сходства – 15,2%.
Таблица 1. Сравнение полученных последовательностей.
                                                                                                                                                               
                                            *                 2 0                   *                 4 0                   *                 6 0              
O 5 9 3 4 2 _ P Y R   :   V T I E K E P Q R I V S L A P S I T E T L Y F I G A L D K V V G V T K F D D F P P G V K K G R T I I G D F S N P N I E V I A   :   6 2
O 3 4 8 0 5 _ B A C   :   V T I K K E P K K I V S L M P S N T E I T Y A L G L G D K V V G V T T N D T Y P K E V K K V E K V G - - D M N V N V E K V I   :   6 0
B T U F _ E C O L I   :   L W L N A A P - R V I T L S P A N T E L A F A A G I T P - - V G V S S Y S D Y P P Q A Q K I E Q V S - T W Q G M N L E R I V   :   5 8
Q 4 8 9 3 9 _ M E T   :   T I G T S S P S A I L V Y M L A P D K L A G W N S K Q N F T Q P F M D E N Y S N L P V I G N W L G S - - - K T G N Y E T V I   :   5 9
Y 8 7 2 _ M E T J A   :   I V T D F Y C P I I S A A D I L N A Y H H T I V G A P K Y A V E K S P K L K E L F D E G K V V D I G S P S K G V N Y E L I V   :   6 2
                                      p     6                             g           v                           k                       N   E   6            
                                                                                                                                                                       
                                            *                 2 0                   *                 4 0                   *                 6 0                      
O 5 9 3 4 2 _ P Y R   :   Q R I V S L A P S I T E T L Y F I G A L D K V V G V T - K F D D F P P G V K K G R T I I G - - - D F S N P N I E V I A - - - - - - -   :   5 5
O 3 4 8 0 5 _ B A C   :   K K I V S L M P S N T E I T Y A L G L G D K V V G V T - - T N D T Y P K E V K K V E K V G - - - - D M N V N V E K V I - - - - - - -   :   5 3
B T U F _ E C O L I   :   - R V I T L S P A N T E L A F A A G I T P V G V S S Y - - - - S D Y P P Q A Q K I E Q V S - - - T W Q G M N L E R I V - - - - - - -   :   5 1
Q 4 8 9 3 9 _ M E T   :   T I G T S S P S A I L V Y M L A P D K L A G W N S K Q N F T Q P F M D E N Y S N L P V I G N W L G S K T G N Y E T V I - - - - - - -   :   5 9
Y 8 7 2 _ M E T J A   :   - - I I S A A D I L N A Y H H T I V G A P K Y A V E K S P K L K E L F D E G K - V V D I G S - - P S K G V N Y E L I V - - - - - - -   :   5 4
                                  3                                                                             6 g                 N   E   6