Поиск по сходству. BLAST, E-Value
1. Гомологичность белков
Для выполнения практикума я взяла белок пилин (ANW70673.1)
[1] организма Neisseria meningitidis [2] .
Дальше я провела поиск в BLAST, после чего выбрала 9 последовательностей (не считая изначальной) с достаточным E-value. Первый сеанс поиска
(длина слова - 6 букв, база данных - SwissProt) -выдал всего 7 находок. Второй сеанс (длина слова - 3 буквы, база данных - SwissProt) - уже большее
количество, но большинство из них были с очень низким E-value и идентичностью, названия абсолютно не соответствовали названию изначальной
последовательности. Я решила остановиться на следующих параметрах поиска: длина слова - 6 букв, база данных - RefSeq (первые две последовательности с высоким E-value я нашла в другом таксоне: Neisseria относится к b-proteobacteria, а поиск проводился по a-proteobacteria.
первые 13 результатов - последовательности с очень высокой идентичностью и одинаковым названием (все принадлежат Neisseria meningitidis). Есть подозрение,что это могут быть разные аннотации одого и того же белка, или очень схожие белки разных штаммов одного таксона, поэтому я не включила их в выборку. А вот эти включила:
Таблица 1. Основные данные о последовательностях (BLAST)
ID |
Name |
Coverage (%) |
Identity (%) |
E-value |
Homology(+/-) |
WP_060846362.1 |
peptide chain release factor-like protein (Methylobacterium aquaticum) |
61% |
28% |
0.19 |
- |
WP_051312207.1 |
hypothetical protein (Pseudodonghicola xiamenensis) |
33% |
44% |
9,9 |
- |
WP_002258782.1 |
pilin family protein |
93% |
97% |
3e-56 |
+ |
WP_061734064.1 |
pilus assembly protein PilS |
98% |
82% |
6e-52 |
+ |
WP_061818162.1 |
pilin |
97% |
77% |
7e-48 |
+ |
WP_002225897.1 |
fimbrial protein MS11-D1 precursor |
98% |
77% |
6e-47 |
+ |
WP_025460956.1 |
prepilin-type cleavage/methylation domain-containing protein |
94% |
75% |
4e-46 |
+ |
WP_079758344.1 |
fimbrial protein P9-2 precursor |
98% |
75% |
4e-45 |
+ |
WP_082299213.1 |
fimbrial protein (Neisseria gonorrhoeae) |
95% |
76% |
1e-44 |
- |
Для установления гомологии я провела множественное выравнивание беков:
Из выравнивания можно сделать вывод о том, что чётко выделяются пять последовательностей, гомологичных исходной, на что указывает блок. Блок нашёлся всего один, но он имеет довольно чёткие границы, в отличие от остальных "претендентов на блок".
Последовательности в таблице стоят не в том же порядке, что последовательности в выравнивании, гомологичные отмечены "+" в соответствующей графе таблицы.
Проект выравнивания
2. Перестройки, карты локального сходства
Я выбрала две домаенные архитектуры из семейства LIM с помощью ресурса Pfam . Две доменные архитектуры, которые я сравнивала это:
1.PET and Zinc finger domain containing protein, {ECO:0000313|EMBL:CDJ85745.1}, 470 ак остатков.
2.LIM domain-containing protein jub, {ECO:0000313|EMBL:KRY15501.1}б 849 ак остатков. E-value = 4e-19
Карта локального сходства выглядит так:
Интерпритация карты: Скорее всего, карта была построена не по всей длине последовательностей, а по находкам, предположительно по чёрной границе:
На карте локального сходства оранжевым обозначены находки BLAST, а голубым - то, что по логике вещей должно находиться. Таким образом, домен LIM, состоящий примерно из 60 аминокислотных остатков
и обозначенный на карте как "А", шесть раз встречается в первой доменной архитектуре, три раза - во второй. Это вполне соответствует картинке доменной архитектуры.
Было бы логично предположить, что эволюционное событие, которое иллюстрирует эта карта - это дупликация комплекса из 3х доменов LIM.
Источники:
1. Краткая информация о белке
2. Краткая информация о прокариоте
3. Презентация про BLAST
|