1. Поиск отличий между двумя разными выравниваниями
В этой части данного практикума нам необходимо было найти различия между разными выравниваями одних и тех же последовательностей. Выбор белка остался за нами, и я взял известный опухолевый супрессор p53. В моём выборе организмов также отсутствует оригинальность - мышь и человек (Mus musculus и Homo sapiens). Для сравнения я взял алгоритмы множественного выравнивания Muscle и Mafft. Чтобы провести множественное выравнивание, я добавил ещё один организм - крысу (Rattus norvegicus). Таким образом было сохранено близкое эволюционное расстояние (ну, я попытался). После проведения выравнивания я удалил последовательность крысы, для упрощения сравнения. Отличий оказалось не так много и все они сосредоточены в начале (36-47 для Mafft, 36-43 для Muscle). После этого выравнивание одинаковое, но немного сдвинутое (Muscle оканчивается 399, а Mafft - 402).
Muscle
Mafft
Список файлов:
Изначальное выравнивание в Muscle
Изначальное выравнивание в Mafft
Последовательности: Человек; Мышь; Крыса.
Положение | 37 Human | 38 Human | 39 Human | 42 Human | 44 Human | 45 Human | 46 Human |
---|---|---|---|---|---|---|---|
Muscle | S | P | L | P | Q | A | M |
Mafft | - | - | - | S | L | P | S |
Таблица 1. Сравнение алгоритмов Muscle и Mafft
2. Построение и описание карты локального сходства двух белков
В этой части практикума я познакомился с картой локального сходства. Для сравнения я выбрал белок цинковых пальцев (zinc finger), так как меня заинтересовало название. Цинковые пальцы - цинксодержащие белки, связывающихся с ДНК и являющихся одними из основных регуляторов транскрипции. Также приведу определение, данное на сайте UniProt, в разиле help. "A zinc finger is a small, functional, independently folded domain that coordinates one or more zinc ions to stabilize its structure through cysteine and/or histidine residues. Zinc fingers are structurally diverse and exhibit a wide range of functions, from DNA- or RNA-binding to protein-protein interactions and membrane association." Так как нам надо было взять один организм из царства Растения и один из царства Животные, то я решил взять любимый объект биологов Arabidopsis thaliana, и собаку Canis lupus familiaris.Arabidopsis thaliana | Canis lupus familiaris | |
---|---|---|
ID | IDD10_ARATH | ZN331_CANLF |
AC | Q700D2; Q0WQ14; Q9FYN0; Q9LYX0 | Q6JLC9 |
RecName | Zinc finger protein JACKDAW | Zinc finger protein 331 |
FT | FT CHAIN 1..490 FT DOMAIN 6..78 FT ZN_FING 132..154 FT ZN_FING 160..182 FT ZN_FING 188..210 FT ZN_FING 216..238 FT ZN_FING 244..266 FT ZN_FING 272..294 FT ZN_FING 300..322 FT ZN_FING 328..350 FT ZN_FING 356..378 FT ZN_FING 384..406 FT ZN_FING 412..434 FT ZN_FING 440..462 FT CROSSLNK 109 FT CROSSLNK 401 | FT CHAIN 1..503 FT ZN_FING 82..104 FT ZN_FING 124..154 FT ZN_FING 159..182 FT ZN_FING 186..209 FT REGION 196..208 FT MOTIF 100..107 FT MOTIF 146..153 FT COMPBIAS 222..245 FT COMPBIAS 300..415 FT METAL 161 FT METAL 164 FT METAL 177 FT METAL 181 FT METAL 188 FT METAL 190 FT METAL 203 FT METAL 207 FT MOD_RES 72 FT CONFLICT 435 FT STRAND 162..164 FT STRAND 167..170 FT HELIX 171..180 FT STRAND 184..187 FT STRAND 193..195 FT HELIX 197..206 |
Function | JACKDAW controls epidermal patterning in the Arabidopsis root meristem through a non-cell-autonomous mechanism. (на самом деле выполняет множество функций, но эта находится отдельно, а остальные в поле взаимодействия) | May be involved in transcriptional regulation. May play a role in spermatogenesis (By similarity). |
Length | 503 | 490 |
Таблица 2. Информация об исследуемых белках.
Далее при помощи BLAST было проведено выравнивание (файл). Ниже приведена карта выравнивания.
Из карты видим, что нашлось много локальных выравниваний для участка от 82-204 для Arabidopsis thaliana и для участка 480-503 (указана наибольшая длина, все остальные лежат внутри данных интервалов). Для Canis lupus familiaris 129-476. Итого для собаки эти выравнивания покрыли большую часть длины, а у арабидопсиса остались 2 больших непокрытых участка. Есть проблема, так как имеется большое количество противоречащих друг другу выравниваний (много линий, находящихся одна над другой).
Теперь нам надо сравнить выравнивания Blast и water. У нас уже есть выравнивание BLAST (файл). При помощи команды water получили следующий файл (файл).
BlastIDD10_ARATH 80 NRFVCEICNKGFQRDQNLQLHRRGH--NLPWKLKQRSK-----------QEV-IKKKVYICPIKTCVHHDASRALGDLTGIKKHYSRKHGEKKWKCEKCSKKYAVQSDWKAHAKT-CGTREYKC-DCGTLFSRKDSFITHR 204 N + C+ C K F R L H++ H P++ K+ K Q++ +K Y C D +A + + H GEK ++C+ C K + + H + G ++Y+C DCG FSR I H+ ZN331_CANLF 130 NSYECKECGKAFSRGYQLTQHQKIHTGEKPYECKECKKAFRWGNQLTQHQKIHTGEKPYECK-------DCGKAFRWGSSLVIHKRIHTGEKPYECKDCEKAFRRGDELTQHQRFHTGEKDYECKDCGKTFSRVYKLIQHK 263Water
IDD10_ARATH 80 NRFVCEICNKGFQRDQNLQLHRRGH--NLPWKLKQRSK-----------QEV-IKKKVYICPIKTCVHHDASRALGDLTGIKKHYSRKHGEKKWKCEKCSKKYAVQSDWKAHAK-TCGTREYKC-DCGTLFSRKDSFITHR 204 |.:.|:.|.|.|.|...|..|::.| ..|::.|:..| |:: ..:|.|.| .|..:|....:.:..|.....|||.::|:.|.|.:....:...|.: ..|.::|:| |||..|||....|.|: ZN331_CANLF 130 NSYECKECGKAFSRGYQLTQHQKIHTGEKPYECKECKKAFRWGNQLTQHQKIHTGEKPYEC-------KDCGKAFRWGSSLVIHKRIHTGEKPYECKDCEKAFRRGDELTQHQRFHTGEKDYECKDCGKTFSRVYKLIQHK 263
Из-за разной расстановки гэпов получаем, что, например, в 1 случае Лизин заменяется на Пролин, а во втором на Гистидин. В матрице Blosum62 обе эти замены имеют равный вес (-1). Аналогично Треонин на Фенилаланин и Треонин на Гистидин (-2). Исходя из данных в поле FT, данные участки и отвечают за формирование цинкового пальца, поэтому они и не сильно изменились в ходе эволюции.