Для того, чтобы оценить давление отбора на ген белка гистидин-тРНК синтетазы начиная с момента расхождения кишечной палочки и синегнойной палочки, были получены соответствующие аминокислотные последовательности и CDS (из базы данных SwissProt):
АК последовательность белка syh_ecoli;
АК последовательность белка syh_pseab;
Выравнивание, по которому в организме Pseudomonas aeruginosa (синегнойной палочке) отбирался ортолог:
>sp|Q02RV6.1|SYH_PSEAB Histidyl-tRNA synthetase (Histidine--tRNA ligase) (HisRS)
Length=429
Score = 522 bits (1344), Expect = 8e-150, Method: Compositional matrix adjust.
Identities = 263/427 (61%), Positives = 322/427 (75%), Gaps = 5/427 (1%)
Query 1 MAKNIQAIRGMNDYLPGETAIWQRIEGTLKNVLGSYGYSEIRLPIVEQTPLFKRAIGEVT 60
M+K++QAIRGMND LP +T W+ +E T +L YGYSEIRLPI+E T LF R IGE T
Sbjct 1 MSKSLQAIRGMNDILPEQTPAWRYLERTFAGLLDGYGYSEIRLPILEFTELFARGIGEGT 60
Query 61 DVVEKEMYTFEDRNGDSLTLRPEGTAGCVRAGIEHGLLYN-QEQRLWYIGPMFRHERPQK 119
DVV+KEMYTF DRNG+SLT+RPEGTAGCVRA +EHGL Q Q+LWY GPMFR+E+PQK
Sbjct 61 DVVDKEMYTFLDRNGESLTMRPEGTAGCVRAVLEHGLSGGGQVQKLWYTGPMFRYEKPQK 120
Query 120 GRYRQFHQLGCEVFGLQGPDIDAELIMLTARWWRALGISEHVTLELNSIGSLEARANYRD 179
GRYRQFHQ+G EVF L GPDIDAELI+LT R W+ LG+++ VTL+LN++GS EARA YR+
Sbjct 121 GRYRQFHQIGVEVFNLPGPDIDAELIILTWRLWQKLGMADAVTLQLNTLGSSEARARYRE 180
Query 180 ALVAFLEQHKEKLDEDCKRRMYTNPLRVLDSKNPEVQALLNDAPALGDYLDEESREHFAG 239
ALVA+L++ E+LDED +RRM TNPLR+LDSK QALL AP L DYLDEES HF G
Sbjct 181 ALVAYLQERFEQLDEDSQRRMTTNPLRILDSKVESTQALLVGAPTLHDYLDEESIAHFEG 240
Query 240 LCKLLESAGIAYTVNQRLVRGLDYYNRTVFEWVTNSLGSQGTVCAGGRYDGLVEQLGGRA 299
L L++ G+ Y +NQ+LVRGLDYY RT FEWVT+ LG+QGTVC GGRYDGLV Q GG+
Sbjct 241 LKARLDAVGLRYEINQKLVRGLDYYCRTAFEWVTDKLGAQGTVCGGGRYDGLVSQFGGKP 300
Query 300 TPAVGFAMGLERLVLLVQA--VNPEFKADPVVDIYLVASGADTQSAAMALAERLRDELPG 357
TP VGFAMG+ERLVLL++ V P P D+Y+ A G + AA+ LAE+LR +PG
Sbjct 301 TPGVGFAMGVERLVLLLETLGVIPAELNRP-ADLYVCAFGEPAELAALTLAEQLRSAIPG 359
Query 358 VKLMTNHGGGNFKKQFARADKWGARVAVVLGESEVANGTAVVKDLRS-GEQTAVAQDSVA 416
++L+ N G G+FK QF +ADK GAR A++LGE EVAN K LR GEQ ++A D++
Sbjct 360 IRLLVNAGAGSFKSQFKKADKSGARFALILGEDEVANRVVGFKPLRDEGEQQSIAWDALP 419
Query 417 AHLRTLL 423
HL L
Sbjct 420 EHLAACL 426
Как видно из выравнивания, процент ID находится в допустимых пределах (60-80%), а описание белков одинаково, что свидетельствует об ортологии. Далее были сделаны выравнивания с помощью программы Needle:
сравнение выравниваний: аминокислотное выравнивание достаточно хорошее и дает 61% идентичности, в то время как нуклеотидное содержит очень много гэпов, и хотя идентичность примерно та же. Но программа Needle выравнивает нуклеотиды, а не кодоны. В результате получается совершенно бессмысленное выравнивание, с которым нельзя работать. Эта программа больше подходит для выравнивания белков, чем для ДНК.
Дальше работа велась с сервером PAL2NAL.
© Даниленко Светлана