Выравнивание последовательностей




1. Построение выравнивания фрагментов последовательностей двух родственных белков.

2. Построение катры локального сходства последовательностей.

В результате построения карты локального сходства последовательностей мы получили табличку:


Для построения этой таблицы использовались функции:
  1. ПСТР - перенос нужного количества символов из указанной ячейки, начиная с нужного символа.
  2. СОВПАД - сравниевает значения в ячейках и возвращает значение ИСТИНА/ЛОЖЬ.
  3. ЕСЛИ - записывает значение истины(в нашел случае 1), если выполяется условие (совпадение значений в ячейках)
Оптимальное, по моему мнению, выравнивание я покрасила в зеленый цвет. Если аминокислотный остаток в строчке/столбце не имеет совпадений, входящих в выравнивание, то на месте совпадающей буквы идет gap. Так же выравнтивать можно не только по совпадающим остаткам, но и по сходным остаткам из таблицы BLOSUM62. В моем примере GeneDoc сам выравнял единственно возможные сходные остатки : V и I.
Файл alignment_excel.xlsx содержит excel-файл с картой локального сходства.

3. Выравнивание первого фрагмента из задания 1 с последовательностью аминокислотный остатков белка PTAS_BACSU с помощью программы bl2seq.

C помощью программы bl2seq можно посторить частичные выравнивания для одинаковых или очень сходных посдедовательностей.
Для построения выравнивания перехоим на сайт NCBI BLAST. Далее по ссылке Align(внизу страницы в списке Specialized BLAST 9 сверху). После этого заходим в вкладку blastp, предназначенную для выравнивания белковых последовательностей. В этой вкладке в окно Enter Query Sequence вставляем последовательность белка PTAS_BACSU в fasta формате, а в окно Enter Subject Sequence последовательность из задания 1. Нажимаем кнопку BLAST и получаем нужное нам выравнивание:

>lcl|14079 unnamed protein product
Length=21

 Score = 47.4 bits (111),  Expect = 6e-13, Method: Compositional matrix adjust.
 Identities = 21/21 (100%), Positives = 21/21 (100%), Gaps = 0/21 (0%)

Query  160  EQYVFADCAINIAPDSQDLAE  180
            EQYVFADCAINIAPDSQDLAE
Sbjct  1    EQYVFADCAINIAPDSQDLAE  21

Так как мы строили частичное выравнивание, то выравнивалась не вся последовательность белка PTAS_BACSU, а только его часть. Какая именно? Это можно узнать в строчке Query: 160-180.

4. Выравнивание последовательности белка PTAS_BACSU с последовательностью гомологичного белка PTA_STAAW с помощью bl2seq.

Чтобы выровнять последовательности сначала найдем в базе данных UniProt голомологичный белок PTA_STAAW.
Впишем как в предыдущем задании в окна последовательности в fasta формате и получим результат:

>lcl|62221 sp|Q8NXW4|PTAS_STAAW Phosphate acetyltransferase OS=Staphylococcus 
aureus (strain MW2) GN=pta PE=3 SV=1
Length=328

 Score =  436 bits (1121),  Expect = 1e-157, Method: Compositional matrix adjust.
 Identities = 214/327 (65%), Positives = 268/327 (82%), Gaps = 4/327 (1%)

Query  1    MADLFSTVQEKVAGKDVKIVFPEGLDERILEAVSKLAGNKVLNPIVIGNENEIQAKAKEL  60
            MADL + +++K++GK+VKIV PEG DER+L A ++L     + PIV+G+E ++Q+ A++L
Sbjct  1    MADLLNVLKDKLSGKNVKIVLPEGEDERVLTAATQLQATDYVTPIVLGDETKVQSLAQKL  60

Query  61   NLTLGGVKIYDPHTYEGMEDLVQAFVERRKGKATEEQARKALLDENYFGTMLVYKGLADG  120
            +L +  +++ +P T E   +LVQ+FVERRKGKATEEQA++ L + NYFGTMLVY G ADG
Sbjct  61   DLDISNIELINPATSELKAELVQSFVERRKGKATEEQAQELLNNVNYFGTMLVYAGKADG  120

Query  121  LVSGAAHSTADTVRPALQIIKTKEGVKKTSGVFIMARGEEQYVFADCAINIAPDSQDLAE  180
            LVSGAAHST DTVRPALQIIKTK GV +TSG+F M +G+ QY+F DCAIN   DSQ LAE
Sbjct  121  LVSGAAHSTGDTVRPALQIIKTKPGVSRTSGIFFMIKGDVQYIFGDCAINPELDSQGLAE  180

Query  181  IAIESANTAKMFDIEPRVAMLSFSTKGSAKSDETEKVADAVKIAKEKAPELTL----DGE  236
            IA+ESA +A  F ++P+VAMLSFSTKGSAKSD+  KV +AVK+A++KA E  L    DGE
Sbjct  181  IAVESAKSALSFGMDPKVAMLSFSTKGSAKSDDVTKVQEAVKLAQQKAEEEKLEAIIDGE  240

Query  237  FQFDAAFVPSVAEKKAPDSEIKGDANVFVFPSLEAGNIGYKIAQRLGNFEAVGPILQGLN  296
            FQFDAA VP VAEKKAP ++++GDANVFVFPSLEAGNIGYKIAQRLG ++AVGP+LQGLN
Sbjct  241  FQFDAAIVPGVAEKKAPGAKLQGDANVFVFPSLEAGNIGYKIAQRLGGYDAVGPVLQGLN  300

Query  297  MPVNDLSRGCNAEDVYNLALITAAQAL  323
             PVNDLSRGC+ EDVYNL++ITAAQAL
Sbjct  301  SPVNDLSRGCSIEDVYNLSIITAAQAL  327


Если нажать на вкладку Dot Matrix View, то появляется карта локального сходства, которая и представлена ниже:


ID PTAS_BACSU PTAS_STAAW
Organism species Bacillus subtilis Staphylococcus aureus (strain MW2)
Процент идентичности (Identities) 65%
Процент сходства (Positives) 82%
Число символов разрыва (Gaps) 4 0
Число идущих подряд символов разрыва 4 0
Суммарное число гэповых колонок 4
Координаты выровненного участка 1-323 1-327


© Butusova Anna,2012