Элементарные эволюционные события |
||||
Задание. Оценить давление отбора на ген заданного белка (работа с веб-сервером PAL2NAL)Биологическая задача состояла в том, чтобы оценить давление отбора на ген заданного белка в период, начиная с момента расхождениякишечной палочки и синегнойной палочки.
Последовательность его гена; Последовательность гомолога этого белка - HSLU_PSEA7 - из синегнойной палочки; Последовательность его гена; При помощи программы blastp был найден гомолог данного белка HSLU_ECOLI в организме синегнойной палочки (Pseudomonas aeruginosa). Ниже приведено соответствующее выравнивание. Как видно, последовательности совпадают на 72%, а также имеют похожие аннотации в UniProt (описание белка из кишечной палочки - ATP-dependent hsl protease ATP-binding subunit hslU (Heat shock protein hslU)). Эти данные позволяют сделать вывод, что последовательности в первом приближении являются ортологами. >ref|YP_001351110.1| heat shock protein HslVU, ATPase subunit HslU [Pseudomonas aeruginosa PA7] sp|A6VDH5.1|HSLU_PSEA7 ATP-dependent hsl protease ATP-binding subunit hslU gb|ABR81627.1| heat shock protein HslVU, ATPase subunit HslU [Pseudomonas aeruginosa PA7] Length=447 GENE ID: 5353816 hslU | heat shock protein HslVU, ATPase subunit HslU [Pseudomonas aeruginosa PA7] Score = 637 bits (1642), Expect = 0.0, Method: Compositional matrix adjust. Identities = 321/445 (72%), Positives = 379/445 (85%), Gaps = 5/445 (1%) Query 4 MTPREIVSELDKHIIGQDNAKRSVAIALRNRWRRMQLNEELRHEVTPKNILMIGPTGVGK 63 MTPREIV EL++HIIGQD+AKR+VAIALRNRWRRMQL ELR EVTPKNILMIGPTGVGK Sbjct 3 MTPREIVHELNRHIIGQDDAKRAVAIALRNRWRRMQLPAELRAEVTPKNILMIGPTGVGK 62 Query 64 TEIARRLAKLANAPFIKVEATKFTEVGYVGKEVDSIIRDLTDAAVKMVRVQAIEKNRYRA 123 TEIARRLA+LANAPFIKVEATKFTEVGYVG++V+SIIRDL DAAVKM+R Q I+K +YRA Sbjct 63 TEIARRLARLANAPFIKVEATKFTEVGYVGRDVESIIRDLADAAVKMLREQEIQKVKYRA 122 Query 124 EELAEERILDVLIPPAKNNWG-QTEQQQEPSAARQAFRKKLREGQLDDKEIEIDLAAAPM 182 E+ AEERILD L+P A+ G E +E S RQ FRK+LREGQLDDKEI+I++A P Sbjct 123 EDAAEERILDALLPAARPAMGFGDEPAREDSNTRQLFRKRLREGQLDDKEIDIEVADNPA 182 Query 183 GVEIMAPPGMEEMTSQLQSMFQNLGGQKQKARKLKIKDAMKLLIEEEAAKLVNPEELKQD 242 GVEIMAPPGMEEMT+QLQ++F + K+K RKLK+ DA+K++ +EEAA+LVN EELK Sbjct 183 GVEIMAPPGMEEMTNQLQNLFSGMSKGKKKTRKLKVADALKMIRDEEAARLVNEEELKAR 242 Query 243 AIDAVEQHGIVFIDEIDKICKRGESSGPDVSREGVQRDLLPLVEGCTVSTKHGMVKTDHI 302 A++AVEQHGIVFIDEIDKI KR + G DVSREGVQRDLLPL+EGCTV+TK GMVKTDHI Sbjct 243 ALEAVEQHGIVFIDEIDKIAKRANAGGADVSREGVQRDLLPLIEGCTVNTKLGMVKTDHI 302 Query 303 LFIASGAFQIAKPSDLIPELQGRLPIRVELQALTTSDFERILTEPNASITVQYKALMATE 362 LFIASGAF ++KPSDL+PELQGRLPIRVEL+AL+ +DFERILTEP+AS+T QY+ L+ TE Sbjct 303 LFIASGAFHLSKPSDLVPELQGRLPIRVELKALSPNDFERILTEPHASLTEQYRELLKTE 362 Query 363 GVNIEFTDSGIKRIAEAAWQVNESTENIGARRLHTVLERLMEEISYDASDLSGQN----I 418 G+ IEF + GIKR+AE AWQVNE TENIGARRLHT+LERL+EE+S+ A+DL+ ++ I Sbjct 363 GLGIEFAEDGIKRLAEIAWQVNEKTENIGARRLHTLLERLLEEVSFSAADLASEHSDKPI 422 Query 419 TIDADYVSKHLDALVADEDLSRFIL 443 IDA YV+ HL L DEDLSR+IL Sbjct 423 RIDAGYVNSHLGELAEDEDLSRYIL 447 Построение выравниванийС помощью программы needle с параметрами по умолчанию были построены попарные белковое и нуклеотидное выравнивания.Выравнивание белков Нуклеотидное выравнивание Нуклеотидное выравнивание не соответствует белковому. Возможно, нуклеотидное выравнивание хуже из-за малого значения штрафа за появление гэпов. При изменении gap penalty от 10 до 20, выравнивание незначительно улучшается. При дальнейшем повышении штрафа за гэпы выравнивание не меняется. PAL2NALPAL2NAL - это программа, которая конвертирует множественное выравнивание последовательностей белков и соответствующие им последовательности ДНК (или мРНК) в выравнивание кодонов. Программа автоматически определяет соответствующую последовательность кодонов, даже если последовательность ДНК (или мРНК) не полностью совпадает с белковой или содержит нетранслируемые участки и полиаденилированные концы. Она также учитывает возможность сдвига рамки считывания в исходном выравнивании, поэтому эта программа подходит для анализа псевдогенов. Результирующее триплетное выравнивание предназначено для оценки частот и типов нуклеотидных замен. Если выравниваются две последовательности, PAL2NAL автоматически считает значения Ks и Ka.Построение нуклеотидного выравнивания с разбивкой на кодоныПрограмма PAL2NAL построила нуклеотидное выравнивание с разбивкой на кодоны. Выравнивания, построенные программой needle и PAL2NAL существенно различаются. Программа PAL2NAL построила лучшее выравнивание с очень малым числом гэпов, что свидетельствует о высоком сходстве двух последовательностей, кроме того, это выравнивание основывается на аминокислотном, что дает основание больше ему доверять. Выравнивание, построенное программой needle, по какой-то причине показывает не очень большой процент сходств, хотя аминокислотное выравнивание, построенное этой же программой показывает более высокий процент. Это также свидетельствует о том, что программа PAL2NAL строит более достоверное выравнивание.С помощью PAL2NAL получены значения Ka/Ks для сравниваемых геновВыравнивание и значения в формате fasta.Для рассчета значений Ka/Ks в меню "Option settings" необходимо выбрать пункты "Remove gaps, inframe stop codons" и "Calculate KS and KA". KS = 66.6603 KA = 0.1874 KA/KS = 0.0028Значение Ka/Ks значительно меньше 1. Это свидетельствует о том, что в период, начиная с момента расхождения синегнойной и кишечной палочек, на ген белка кишечной палочки действовал стабилизирующий отбор. | на главную | назад
|