На главную

Выравнивание последовательностей

Практикум 10: Анализ множественных выравниваний

В данной работе обрабатывается множественное выравнивание, полученное в результате предыдущего практикума.

Вертикальные блоки

Вертикальный блок определяется как участок множественного выравнивания, обладающий следующими свойствами:

В выравнивании последовательностей с идентификаторами Uniprot A0A0C5WMF1_9GAMM, B8J2I4_DESDA, I3R784_HALMT, F6GDD7_LACS5 и D8MWG5_ERWBE было найдено 3 вертикальных блока, то есть участка, на котором для каждой колонки можно ожидать гомологию остатков из всех последовательностей. Вертикальные блоки обозначены символом B.

 
 
tr|F6GDD7|F6GDD7_LACS5/1-113tr|B8J2I4|B8J2I4_DESDA/1-130tr|I3R784|I3R784_HALMT/1-126tr|A0A0C5WMF1|A0A0C5WMF1_9GAMM/1-131tr|D8MWG5|D8MWG5_ERWBE/1-128Вертикальные блокиConservationQualityConsensus
132333435363738393103113123VEAIIRKSKFSVVQEALQSVGVNFFTHWDVISIDNENQDVL------DLISSEANKENSKKCYL--SIIVNDDFKA------VTIKAILESA----STGAIGDGRIF---ISTIDEAYKIRTKEKGKKTLSYTLPEDRSYTDEHIWLREDAQGLT-----VGISDFAQAQLEEVVYVDMPAVGSAVEAGKEFGSVESMKSVSALFSPVSGVVEAVNTDLENKPDLVNSDCYGQGWILRLRREGDNAV-PLLSAEEYRTHLMFEIPDDRKYLESHEWTTTEGDTVR-----IGISDFAQDELGDVVFVELPTEGDELDAGDEFGVVESIKAVSDLYAPISGTVTAVNEALFDAPELVNDDPYGDGWMFEMEPSDTDEFDDLLSPEEYREQTMSYIPSELKFTNTHEWVRHEGDGIFT----VGITDHAQSLLGDMVFVDLPEIDAATEAGEDCAVAESVKAASDIYAPLSGFVIAINEDLEGSPELVNSDPYGDGWLFQLKVEDDGEFADLLDADSYSDLVMSNVPNELKYRDSHEWVRKEADGTYT----VGITEHAQELLGDMVFVDLPDVGNTYSQGDDCAVAESVKAASDIYAPISGEIIEVNSALDGEPELVNSAPYAEGWLFKIKASNESELDSLLDADAYKGSIBBBBBBBBBBBBBBBBBBBBBBBBBBBBB53396563593436566734+4754-----98*7747*44*0313239964345436686686523*866675868223302449643*453232397577+7*698112265454602+5739365326 MS+IP+++KYTDSHEW+R+EGDG+FTHWDVVGI+D+AQDLLGD+VFVDLP+VGAA+EAG++C+V+ES+KA+SD+YAPISG+VIAVNE+LEGAPELVNSDPYGDGW+F+LK+SDDDEFDDLL+AEEY+++L

скрипт

Проект JalView. То же в формате fasta.

Один блок из части последовательностей

Мы включили в блок все последовательности, кроме D8MWG5_ERWBE.

Символом H выделены участки, на которых в пределах группы все остатки с очень высокой вероятностью гомологичны ввиду абсолютной консервативности колонок.

скрипт  
 
tr|F6GDD7|F6GDD7_LACS5/1-113tr|B8J2I4|B8J2I4_DESDA/1-130tr|I3R784|I3R784_HALMT/1-126tr|A0A0C5WMF1|A0A0C5WMF1_9GAMM/1-131tr|D8MWG5|D8MWG5_ERWBE/1-128segment verticalgap'sВертикальные блокиConservationQualityConsensus
132338485868788898108118128VEAIIRKSKFSVVQEALQSVGVNFFSYTLPEDRSYTDEHIWLREDAQGLTMFEIPDDRKYLESHEWTTTEGDTVRMSYIPSELKFTNTHEWVRHEGDGIFMSNVPNELKYRDSHEWVRKEADGTYISIDNENQDVL------DLISSEANKENSKKCYL--SIIVNDDFKA------VTIKAILESA----STGAIGDGRIF---ISTIDEAYKIRTKEKGKKTLVGISDFAQAQLEEVVYVDMPAVGSAVEAGKEFGSVESMKSVSALFSPVSGVVEAVNTDLENKPDLVNSDCYGQGWILRLRREGDNAV-PLLSAEEYRTHLIGISDFAQDELGDVVFVELPTEGDELDAGDEFGVVESIKAVSDLYAPISGTVTAVNEALFDAPELVNDDPYGDGWMFEMEPSDTDEFDDLLSPEEYREQTVGITDHAQSLLGDMVFVDLPEIDAATEAGEDCAVAESVKAASDIYAPLSGFVIAINEDLEGSPELVNSDPYGDGWLFQLKVEDDGEFADLLDADSYSDLVVGITEHAQELLGDMVFVDLPDVGNTYSQGDDCAVAESVKAASDIYAPISGEIIEVNSALDGEPELVNSAPYAEGWLFKIKASNESELDSLLDADAYKGSIHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHXXXXXXXXXXXXXXXXXXXXXXXXXXXXBBBBBBBBBBBBBBBBBBBBBBBBBBBBB53396563593436566734+475498*7747*44*0313239964345436686686523*866675868223302449643*453232397577+7*698112265454602+5739365326 MS+IP+++KYTDSHEW+R+EGDG+FVGI+D+AQDLLGD+VFVDLP+VGAA+EAG++C+V+ES+KA+SD+YAPISG+VIAVNE+LEGAPELVNSDPYGDGW+F+LK+SDDDEFDDLL+AEEY+++L

Проект JalView. То же в формате fasta.

Число и процент позиций с гэпами на самом длинном участке за пределами блоков

Самый длинный участок выравнивания, не входящий в состав блоков, - это блок с координатами 42-69. Этот участок обозначен символом X.

Таблица 1. Гэпы в блоке 42-69

Позиции Число Процент
С гэпами 8 29%
Всего 28 100%

Число и процент консервативных позиций

Функционально абсолютно консервативными позициями считались позиции со следующими группами аминокислот:

(Список составлен согласно матрице BLOSUM62, использующейся в программах выравнивания. Основанием для такого объединения остатков служат данные о частотах мутаций.)

Параметры были подсчитаны для вертикального блока с координатами 131-138, в нем 8 колонок.

Таблица 2. Консервативные позиции в блоке 131-138

Позиции Число Процент
Абсолютно консервативные 2 25%
Абсолютно функционально консервативные 3 37.5%
Всего 8 100%

Консенсусная последовательность и LOGO одного блока

 
 
tr|F6GDD7|F6GDD7_LACS5/1-113tr|B8J2I4|B8J2I4_DESDA/1-130tr|I3R784|I3R784_HALMT/1-126tr|A0A0C5WMF1|A0A0C5WMF1_9GAMM/1-131tr|D8MWG5|D8MWG5_ERWBE/1-128гэпыВертикальные блокиConservationQualityConsensus
ISIDNENQVGISDFAQIGISDFAQVGITDHAQVGITEHAQBBBBBBBB98*7747* VGI+D+AQVIGSISTDDENFHEANQ
скрипт

В проекте JalView отдельно записан блок 131-138. Тот же блок в формате fasta.

Консенсусная последовательность высчитывается исходя из встречаемости остатков (нуклеотидных или аминокислотных).
Представляет собой результат множественного выравнивания родственных последовательностей, в которых определяются
консервативные мотивы. Удобна при анализе гомологичности белков.

Consensus/34-134 Percentage Identity Consensus
VGI+D+AQ

Чтобы сохранить консенсусную последовательность и LOGO блока 131-138, мы воспользовались программой JalView и сервисом http://weblogo.threeplusone.com/, который принимает на вход совокупность выровненных последовательностей и автоматически выдает искомое изображение в указанном разрешении. По умолчанию аминокислотные последовательности окрашиваются по гидрофобности. Гидрофобные аминокислоты выделяются черным, гидрофильные синим, а нейтральные зеленым.

Паттерн для блока 131-138: [IV]-[SG]-I-[DST]-[NDE]-[EFH]-[NA]-Q
Скобки [] обозначают, что на данную позицию может быть взят любой из символов, указанных в скобках.

Выравнивание с негомологичной последовательностью

Для данного задания была использована последовательность белка с идентификатором Uniprot BLAN1_KLEPN, очевидно не гомологичную пяти последовательностям, исследованным ранее. Было обнаружено некоторое количество "консервативных" колонок, но тем не менее качество выравнивания невысоко.  


 
tr|F6GDD7|F6GDD7_LACS5/4-112sp|C7C422|BLAN1_KLEPN/3-233tr|B8J2I4|B8J2I4_DESDA/3-126tr|I3R784|I3R784_HALMT/1-125tr|A0A0C5WMF1|A0A0C5WMF1_9GAMM/1-126tr|D8MWG5|D8MWG5_ERWBE/1-126ConservationQualityConsensus
102030405060708090100110120130140150160170180190200210220230VEAI--IRKSKFSVVQEALQSVGVNFFTHWDVISID-NENQDVLDLIS----------------------------------------------------------------------------------SEANKENSKKCYLSIIVNDDFKAVTIKAILESA----STG-------------------------------AIGDGRIF---ISTIDEAYKIRTKEKGKKTLLPNIMHPVAKLSTALAAALMLSGCMPGEIRPTIGQQMETGDQRFGDLVFRQLAPNVWQHTSYLDMPGFGAVASNGLIVRDGGRVLVVDTAWTDDQTAQILNWIKQEINLPVALAVVTHAHQDKMGGMDALHAAGIATYANALSNQLAPQEGMVAAQHSLTFAANGWVEPATAPNFGPLKVFYPGPGHTSDNITVGIDGTDIAFGGCLIKDSKAKSLGNLGDA-DTEHYAASASYTL--PEDRSYTDEHIWLREDAQGLT-----VGIS-DFAQAQLEEVV-------------YVDMPAVGSAVEAG-------------------------------------------------------KEFGSVESMKSVSALFSPVSGVVEAVNTDLENKPDLVNSD-------------------------------CYGQGWILRLR-REGDNAVPLLSAEEYRTHLMFEI--PDDRKYLESHEWTTTEGDTVR-----IGIS-DFAQDELGDVV-------------FVELPTEGDELDAG-------------------------------------------------------DEFGVVESIKAVSDLYAPISGTVTAVNEALFDAPELVNDD-------------------------------PYGDGWMFEMEPSDTDEFDDLLSPEEYREQTMSYI--PSELKFTNTHEWVRHEGDGIFT----VGIT-DHAQSLLGDMV-------------FVDLPEIDAATEAG-------------------------------------------------------EDCAVAESVKAASDIYAPLSGFVIAINEDLEGSPELVNSD-------------------------------PYGDGWLFQLKVEDDGEFADLLDADSYSDLVMSNV--PNELKYRDSHEWVRKEADGTYT----VGIT-EHAQELLGDMV-------------FVDLPDVGNTYSQG-------------------------------------------------------DDCAVAESVKAASDIYAPISGEIIEVNSALDGEPELVNSA-------------------------------PYAEGWLFKIKASNESELDSLLDADAYKGSI5239--6233353333366513+4643-----9876-73774384486-------------22312001100103-------------------------------------------------------3477337646755577684672734654364531013655-------------------------------77+4949510204635762270739264325 MSNIMHP+++KYTDSHEWLR+EGDG+FT+++++GI+MD+AQDLLGD+VFRQLAPNVWQHTSFVDLP+VGAA++AGLIVRDGGRVLVVDTAWTDDQTAQILNWIKQEINLPVALAVVTHAHQDKMGGMDALDE+GVAESVKA+SDIYAPISG+VIAVN++LEGAPELVNSDTAPNFGPLKVFYPGPGHTSDNITVGIDGTDIPYGDGWIF+LKASD+DE+DDLLDAEEY++SL
скрипт

Проект JalView.

Таблица 3. Консервативные позиции при выравнивании с заведомо негомологичной последовательностью

Позиции Число Процент
Абсолютно консервативные 10 4.3%
Абсолютно функционально консервативные 38 16.3%
Всего 232 100%

Выравнивание заведомо неродственных белков

Для данного задания были использованы последовательности белков с идентификаторами Uniprot ISCS_ECOLI, C8W8H7_ATOPD, Q8AAN6_BACTN, B4EAZ8_BURCJ, NANE_CLOPE и PHNS_DESVM.

 
 
UniProt/Swiss-Prot|P0A6B7|P39171|P76581|P76992|Q8XA86|ISCS_ECOLI/1-394tr|C8W8H7|C8W8H7_ATOPD/43-857tr|Q8AAN6|Q8AAN6_BACTN/24-427tr|B4EAZ8|B4EAZ8_BURCJ/1-235sp|Q8XNZ3|NANE_CLOPE/21-193sp|P21853|PHNS_DESVM/1-299blocksConservationQualityConsensus
96106116126136146156166176186196206216226236246256266276286GNPASRSHRFGWQAEEAVDIAR--------------------------------NQIAD---LVGA------------------------------------------------DPREIV--------------FT-------------------------------------SGATESDNLAIKGAANFYQKKGKHIITSKTEHKAVLDGILGVILLLLPIVIGQDRYGSRLWISFGPFTFQPGEIAKIAITLFLAFYLALNREALSVSMRSVGPFRIPRFKMLLPLFVMWGISLIVVIFERDLGSALLFFVFFVIMLYVATGRASYVFVSVA-LLAIGGVILYHFFSHVQTRVNIWLDPFKDPSGDGFQIVQSLYSIADGGLAGTGIDKGMPT---------LIPVVESDFIFSAIAEGNPTVIVH-----SQHDLDSWA--------------------------------NLVARCLYMVGI------------------------------------------------RKTDVFQNSSGYGMFTGGLGFQ-------------------------------------YGAERLGCLTVPAAAG----------NSKRQIKFISDGQVAIVTG-----------GAR----------------GIG-------------RGIALTLAGAGA---------------------NILLADLLDDALD-----------ATAREVRALGRRA--------------------------------------------------AIAKVDVTQAA---------QVDAMVAQ----ALADGRMAI--------------AAK--------------------------------QGGAAAIRAQGVNDINEIKEVTKLPIIG-------IIKRNYDDSEIYIT--------PTMKEVDELLKTD-------------------------------------------------CEMIALDATKRKRPNGENVKDLVDAIHAK-GRLAMADGKEGV----------EERLAER----------------GVSRRDFLKFC-----TAIAVTM-GMGP-----------------------AFAPEVARALM-----------GPRRPSVVYLHNAECTGCSESVLRAFEPYIDTLI---LDTL---SLDYHETI----------MAAAG-DAAEAA---------LEQAVNSPHGFIAVVEAAAAAAAA*4375--------------534--------------------------------6578211-55*5------------------------------------------------6232360101-------------------------------------------------047330535323---------00011283-0007859 GNPAVI+H+++++++EDRD+ARLWISFGPFTFQPGEIAGI++++FL+F+LALNRN+IAVT+RGVG+++I+++K++++L++++GISLI++IFAR+LDDAL++++FFVIMLYVAT+R++DV+L++A++++++G++LF+F+++++T++NIWLD++KDPS+D+++++QSLYSIADGG+AA+GLDA++A++AAG+++K+LVDA+NSK+GFKA+AD
скрипт

Проект JalView.

Таблица 4. Консервативные позиции при выравнивании заведомо негомологичных последовательностей

Позиции Число Процент
Абсолютно консервативные 2 0.6%
Абсолютно функционально консервативные 6 2%
Всего 295 100%


© Екатерина Посицельская, 2016