Для того, чтобы оценить давление отбора на ген белка гистидин-тРНК синтетазы начиная с момента расхождения кишечной палочки и синегнойной палочки, были получены соответствующие аминокислотные последовательности и CDS (из базы данных SwissProt):
АК последовательность белка syh_ecoli;
АК последовательность белка syh_pseab;
Выравнивание, по которому в организме Pseudomonas aeruginosa (синегнойной палочке) отбирался ортолог:
>sp|Q02RV6.1|SYH_PSEAB Histidyl-tRNA synthetase (Histidine--tRNA ligase) (HisRS) Length=429 Score = 522 bits (1344), Expect = 8e-150, Method: Compositional matrix adjust. Identities = 263/427 (61%), Positives = 322/427 (75%), Gaps = 5/427 (1%) Query 1 MAKNIQAIRGMNDYLPGETAIWQRIEGTLKNVLGSYGYSEIRLPIVEQTPLFKRAIGEVT 60 M+K++QAIRGMND LP +T W+ +E T +L YGYSEIRLPI+E T LF R IGE T Sbjct 1 MSKSLQAIRGMNDILPEQTPAWRYLERTFAGLLDGYGYSEIRLPILEFTELFARGIGEGT 60 Query 61 DVVEKEMYTFEDRNGDSLTLRPEGTAGCVRAGIEHGLLYN-QEQRLWYIGPMFRHERPQK 119 DVV+KEMYTF DRNG+SLT+RPEGTAGCVRA +EHGL Q Q+LWY GPMFR+E+PQK Sbjct 61 DVVDKEMYTFLDRNGESLTMRPEGTAGCVRAVLEHGLSGGGQVQKLWYTGPMFRYEKPQK 120 Query 120 GRYRQFHQLGCEVFGLQGPDIDAELIMLTARWWRALGISEHVTLELNSIGSLEARANYRD 179 GRYRQFHQ+G EVF L GPDIDAELI+LT R W+ LG+++ VTL+LN++GS EARA YR+ Sbjct 121 GRYRQFHQIGVEVFNLPGPDIDAELIILTWRLWQKLGMADAVTLQLNTLGSSEARARYRE 180 Query 180 ALVAFLEQHKEKLDEDCKRRMYTNPLRVLDSKNPEVQALLNDAPALGDYLDEESREHFAG 239 ALVA+L++ E+LDED +RRM TNPLR+LDSK QALL AP L DYLDEES HF G Sbjct 181 ALVAYLQERFEQLDEDSQRRMTTNPLRILDSKVESTQALLVGAPTLHDYLDEESIAHFEG 240 Query 240 LCKLLESAGIAYTVNQRLVRGLDYYNRTVFEWVTNSLGSQGTVCAGGRYDGLVEQLGGRA 299 L L++ G+ Y +NQ+LVRGLDYY RT FEWVT+ LG+QGTVC GGRYDGLV Q GG+ Sbjct 241 LKARLDAVGLRYEINQKLVRGLDYYCRTAFEWVTDKLGAQGTVCGGGRYDGLVSQFGGKP 300 Query 300 TPAVGFAMGLERLVLLVQA--VNPEFKADPVVDIYLVASGADTQSAAMALAERLRDELPG 357 TP VGFAMG+ERLVLL++ V P P D+Y+ A G + AA+ LAE+LR +PG Sbjct 301 TPGVGFAMGVERLVLLLETLGVIPAELNRP-ADLYVCAFGEPAELAALTLAEQLRSAIPG 359 Query 358 VKLMTNHGGGNFKKQFARADKWGARVAVVLGESEVANGTAVVKDLRS-GEQTAVAQDSVA 416 ++L+ N G G+FK QF +ADK GAR A++LGE EVAN K LR GEQ ++A D++ Sbjct 360 IRLLVNAGAGSFKSQFKKADKSGARFALILGEDEVANRVVGFKPLRDEGEQQSIAWDALP 419 Query 417 AHLRTLL 423 HL L Sbjct 420 EHLAACL 426
Как видно из выравнивания, процент ID находится в допустимых пределах (60-80%), а описание белков одинаково, что свидетельствует об ортологии. Далее были сделаны выравнивания с помощью программы Needle:
сравнение выравниваний: аминокислотное выравнивание достаточно хорошее и дает 61% идентичности, в то время как нуклеотидное содержит очень много гэпов, и хотя идентичность примерно та же. Но программа Needle выравнивает нуклеотиды, а не кодоны. В результате получается совершенно бессмысленное выравнивание, с которым нельзя работать. Эта программа больше подходит для выравнивания белков, чем для ДНК.
Дальше работа велась с сервером PAL2NAL.
© Даниленко Светлана