На главную

Четвертый семестр

Элементарные эволюционные события

Задание 1. Оценка давления отбора (работа с PAL2NAL)

Для того, чтобы оценить давление отбора на ген белка гистидин-тРНК синтетазы начиная с момента расхождения кишечной палочки и синегнойной палочки, были получены соответствующие аминокислотные последовательности и CDS (из базы данных SwissProt):

АК последовательность белка syh_ecoli;

CDS белка syh_ecoli;

АК последовательность белка syh_pseab;

CDS белка syh_pseab.

Выравнивание, по которому в организме Pseudomonas aeruginosa (синегнойной палочке) отбирался ортолог:

 >sp|Q02RV6.1|SYH_PSEAB  Histidyl-tRNA synthetase (Histidine--tRNA ligase) (HisRS)
 Length=429
 Score =  522 bits (1344),  Expect = 8e-150, Method: Compositional matrix adjust.
 Identities = 263/427 (61%), Positives = 322/427 (75%), Gaps = 5/427 (1%)

Query  1    MAKNIQAIRGMNDYLPGETAIWQRIEGTLKNVLGSYGYSEIRLPIVEQTPLFKRAIGEVT  60
            M+K++QAIRGMND LP +T  W+ +E T   +L  YGYSEIRLPI+E T LF R IGE T
Sbjct  1    MSKSLQAIRGMNDILPEQTPAWRYLERTFAGLLDGYGYSEIRLPILEFTELFARGIGEGT  60

Query  61   DVVEKEMYTFEDRNGDSLTLRPEGTAGCVRAGIEHGLLYN-QEQRLWYIGPMFRHERPQK  119
            DVV+KEMYTF DRNG+SLT+RPEGTAGCVRA +EHGL    Q Q+LWY GPMFR+E+PQK
Sbjct  61   DVVDKEMYTFLDRNGESLTMRPEGTAGCVRAVLEHGLSGGGQVQKLWYTGPMFRYEKPQK  120

Query  120  GRYRQFHQLGCEVFGLQGPDIDAELIMLTARWWRALGISEHVTLELNSIGSLEARANYRD  179
            GRYRQFHQ+G EVF L GPDIDAELI+LT R W+ LG+++ VTL+LN++GS EARA YR+
Sbjct  121  GRYRQFHQIGVEVFNLPGPDIDAELIILTWRLWQKLGMADAVTLQLNTLGSSEARARYRE  180

Query  180  ALVAFLEQHKEKLDEDCKRRMYTNPLRVLDSKNPEVQALLNDAPALGDYLDEESREHFAG  239
            ALVA+L++  E+LDED +RRM TNPLR+LDSK    QALL  AP L DYLDEES  HF G
Sbjct  181  ALVAYLQERFEQLDEDSQRRMTTNPLRILDSKVESTQALLVGAPTLHDYLDEESIAHFEG  240

Query  240  LCKLLESAGIAYTVNQRLVRGLDYYNRTVFEWVTNSLGSQGTVCAGGRYDGLVEQLGGRA  299
            L   L++ G+ Y +NQ+LVRGLDYY RT FEWVT+ LG+QGTVC GGRYDGLV Q GG+ 
Sbjct  241  LKARLDAVGLRYEINQKLVRGLDYYCRTAFEWVTDKLGAQGTVCGGGRYDGLVSQFGGKP  300

Query  300  TPAVGFAMGLERLVLLVQA--VNPEFKADPVVDIYLVASGADTQSAAMALAERLRDELPG  357
            TP VGFAMG+ERLVLL++   V P     P  D+Y+ A G   + AA+ LAE+LR  +PG
Sbjct  301  TPGVGFAMGVERLVLLLETLGVIPAELNRP-ADLYVCAFGEPAELAALTLAEQLRSAIPG  359

Query  358  VKLMTNHGGGNFKKQFARADKWGARVAVVLGESEVANGTAVVKDLRS-GEQTAVAQDSVA  416
            ++L+ N G G+FK QF +ADK GAR A++LGE EVAN     K LR  GEQ ++A D++ 
Sbjct  360  IRLLVNAGAGSFKSQFKKADKSGARFALILGEDEVANRVVGFKPLRDEGEQQSIAWDALP  419

Query  417  AHLRTLL  423
             HL   L
Sbjct  420  EHLAACL  426 

Как видно из выравнивания, процент ID находится в допустимых пределах (60-80%), а описание белков одинаково, что свидетельствует об ортологии. Далее были сделаны выравнивания с помощью программы Needle:

аминокислотное;

нуклеотидное.

сравнение выравниваний: аминокислотное выравнивание достаточно хорошее и дает 61% идентичности, в то время как нуклеотидное содержит очень много гэпов, и хотя идентичность примерно та же. Но программа Needle выравнивает нуклеотиды, а не кодоны. В результате получается совершенно бессмысленное выравнивание, с которым нельзя работать. Эта программа больше подходит для выравнивания белков, чем для ДНК.

Дальше работа велась с сервером PAL2NAL.

  • Pal2Nal делает выравнивания по белковым и нуклеотидным последовательностям таком образом, чтобы можно было оценить эволюционные измененеия в геноме. Он может дать на выход как выравнивание в fasta или CLUSTAL формате, так и разбиение на кодоны, а так же подсчитать значения Ka/Ks.
  • С помощью Pal2Nal было построено выравнивание кодирующих последовательностей с разбивкой на кодоны. Как мы видим, это выравнивание принципиально отличается от выравнивания Needle, т.к. оно ориентируется на сделанное другими программами и поданное на вход в Pal2Nal белковое выравнивание, и ставит в соответствие выравненным аминокислотам кодирующие их кодоны. Таким образом, выравниваются кодоны, а не отдельные буквы последовательности.
  • Было подсчитано значение Ka/Ks. Для этого был выбран пункт "Remove gaps, inframe stop codons, Yes" и подпункт "Calculate KS and KA", а формат выдачи CLUSTAL. Из полученного значения можно сделать вывод, что отбор стабилизирующий и имеет достаточно большую силу, т.к. Ka/Ks намного меньше единицы.

    На главную


    © Даниленко Светлана