Практикум №12

Алгоритм BLAST, матрицы BLOSUM, карты локального сходства

1. Поиск отличий между двумя разными выравниваниями

В этой части данного практикума нам необходимо было найти различия между разными выравниваями одних и тех же последовательностей. Выбор белка остался за нами, и я взял известный опухолевый супрессор p53. В моём выборе организмов также отсутствует оригинальность - мышь и человек (Mus musculus и Homo sapiens). Для сравнения я взял алгоритмы множественного выравнивания Muscle и Mafft. Чтобы провести множественное выравнивание, я добавил ещё один организм - крысу (Rattus norvegicus). Таким образом было сохранено близкое эволюционное расстояние (ну, я попытался). После проведения выравнивания я удалил последовательность крысы, для упрощения сравнения. Отличий оказалось не так много и все они сосредоточены в начале (36-47 для Mafft, 36-43 для Muscle). После этого выравнивание одинаковое, но немного сдвинутое (Muscle оканчивается 399, а Mafft - 402).

muscle

Muscle


mafft

Mafft


Список файлов:

Изначальное выравнивание в Muscle

Изначальное выравнивание в Mafft

Выравнивание без крысы Muscle

Выравнивание без крысы Mafft

Последовательности: Человек; Мышь; Крыса.


Положение 37 Human 38 Human 39 Human 42 Human 44 Human 45 Human 46 Human
Muscle S P L P Q A M
Mafft - - - S L P S

Таблица 1. Сравнение алгоритмов Muscle и Mafft

2. Построение и описание карты локального сходства двух белков

В этой части практикума я познакомился с картой локального сходства. Для сравнения я выбрал белок цинковых пальцев (zinc finger), так как меня заинтересовало название. Цинковые пальцы - цинксодержащие белки, связывающихся с ДНК и являющихся одними из основных регуляторов транскрипции. Также приведу определение, данное на сайте UniProt, в разиле help. "A zinc finger is a small, functional, independently folded domain that coordinates one or more zinc ions to stabilize its structure through cysteine and/or histidine residues. Zinc fingers are structurally diverse and exhibit a wide range of functions, from DNA- or RNA-binding to protein-protein interactions and membrane association." Так как нам надо было взять один организм из царства Растения и один из царства Животные, то я решил взять любимый объект биологов Arabidopsis thaliana, и собаку Canis lupus familiaris.


Arabidopsis thaliana Canis lupus familiaris
ID IDD10_ARATH ZN331_CANLF
AC Q700D2; Q0WQ14; Q9FYN0; Q9LYX0 Q6JLC9
RecName Zinc finger protein JACKDAW Zinc finger protein 331
FT
 
FT   CHAIN           1..490
FT   DOMAIN          6..78
FT   ZN_FING         132..154
FT   ZN_FING         160..182
FT   ZN_FING         188..210
FT   ZN_FING         216..238
FT   ZN_FING         244..266
FT   ZN_FING         272..294
FT   ZN_FING         300..322
FT   ZN_FING         328..350
FT   ZN_FING         356..378
FT   ZN_FING         384..406
FT   ZN_FING         412..434
FT   ZN_FING         440..462
FT   CROSSLNK        109
FT   CROSSLNK        401
 
 
FT   CHAIN           1..503
FT   ZN_FING         82..104
FT   ZN_FING         124..154
FT   ZN_FING         159..182
FT   ZN_FING         186..209
FT   REGION          196..208
FT   MOTIF           100..107
FT   MOTIF           146..153
FT   COMPBIAS        222..245
FT   COMPBIAS        300..415
FT   METAL           161
FT   METAL           164
FT   METAL           177
FT   METAL           181
FT   METAL           188
FT   METAL           190
FT   METAL           203
FT   METAL           207
FT   MOD_RES         72
FT   CONFLICT        435
FT   STRAND          162..164
FT   STRAND          167..170
FT   HELIX           171..180
FT   STRAND          184..187
FT   STRAND          193..195
FT   HELIX           197..206  
Function JACKDAW controls epidermal patterning in the Arabidopsis root meristem through a non-cell-autonomous mechanism. (на самом деле выполняет множество функций, но эта находится отдельно, а остальные в поле взаимодействия) May be involved in transcriptional regulation. May play a role in spermatogenesis (By similarity).
Length 503 490

Таблица 2. Информация об исследуемых белках.

Далее при помощи BLAST было проведено выравнивание (файл). Ниже приведена карта выравнивания.



Из карты видим, что нашлось много локальных выравниваний для участка от 82-204 для Arabidopsis thaliana и для участка 480-503 (указана наибольшая длина, все остальные лежат внутри данных интервалов). Для Canis lupus familiaris 129-476. Итого для собаки эти выравнивания покрыли большую часть длины, а у арабидопсиса остались 2 больших непокрытых участка. Есть проблема, так как имеется большое количество противоречащих друг другу выравниваний (много линий, находящихся одна над другой).

Теперь нам надо сравнить выравнивания Blast и water. У нас уже есть выравнивание BLAST (файл). При помощи команды water получили следующий файл (файл).

Blast

IDD10_ARATH 80  NRFVCEICNKGFQRDQNLQLHRRGH--NLPWKLKQRSK-----------QEV-IKKKVYICPIKTCVHHDASRALGDLTGIKKHYSRKHGEKKWKCEKCSKKYAVQSDWKAHAKT-CGTREYKC-DCGTLFSRKDSFITHR 204
                N + C+ C K F R   L  H++ H    P++ K+  K           Q++   +K Y C        D  +A    + +  H     GEK ++C+ C K +    +   H +   G ++Y+C DCG  FSR    I H+
ZN331_CANLF 130 NSYECKECGKAFSRGYQLTQHQKIHTGEKPYECKECKKAFRWGNQLTQHQKIHTGEKPYECK-------DCGKAFRWGSSLVIHKRIHTGEKPYECKDCEKAFRRGDELTQHQRFHTGEKDYECKDCGKTFSRVYKLIQHK 263
	

Water

IDD10_ARATH 80  NRFVCEICNKGFQRDQNLQLHRRGH--NLPWKLKQRSK-----------QEV-IKKKVYICPIKTCVHHDASRALGDLTGIKKHYSRKHGEKKWKCEKCSKKYAVQSDWKAHAK-TCGTREYKC-DCGTLFSRKDSFITHR 204
                |.:.|:.|.|.|.|...|..|::.|  ..|::.|:..|           |:: ..:|.|.|       .|..:|....:.:..|.....|||.::|:.|.|.:....:...|.: ..|.::|:| |||..|||....|.|:
ZN331_CANLF 130 NSYECKECGKAFSRGYQLTQHQKIHTGEKPYECKECKKAFRWGNQLTQHQKIHTGEKPYEC-------KDCGKAFRWGSSLVIHKRIHTGEKPYECKDCEKAFRRGDELTQHQRFHTGEKDYECKDCGKTFSRVYKLIQHK 263
	

Из-за разной расстановки гэпов получаем, что, например, в 1 случае Лизин заменяется на Пролин, а во втором на Гистидин. В матрице Blosum62 обе эти замены имеют равный вес (-1). Аналогично Треонин на Фенилаланин и Треонин на Гистидин (-2). Исходя из данных в поле FT, данные участки и отвечают за формирование цинкового пальца, поэтому они и не сильно изменились в ходе эволюции.