Учебный сайт Екатерины Швецовой

АТФ-синтаза бактерии Azotobacter vinelandii DJ

В таблице 1. приведены запросы, использованные в процессе поиска белков АТФ-синтазы бактерии Azotobacter vinelandii DJ. Всего было найдено 14 белков АТФ-синтазы, из них в 2 в Swiss-Prot, 12 в TrEMBL. По доказательству существованию белка: 13 белков относится к "Inferred from homology" (выявлены из соображений гомологии), 1 белок относится к "Predicted" (предсказан, точных доказательств существования нет). Белки локализованы в разных локусах. Их можно разделить на две группы: 9 белков (Avin_52150 - Avin_52230) и 5 белков, которые находятся в совсем другом месте (Avin_19670 - Avin_19730). Предположу, что это две разные АТФ-синтазы.

Таблица 1. Запросы в Uniprot для поиска белков АТФ-синтазы Azotobacter vinelandii DJ

Геном или таксон Строка запроса Число записей Комментарии
геном Azotobacter vinelandii DJ organism:"Azotobacter vinelandii DJ" 0 Что-то явно не так...
штаммы Azotobacter vinelandii organism:"Azotobacter vinelandii" 15208 Полное название организма Azotobacter vinelandii (strain DJ / ATCC BAA-1303). Выданы все белки всех штаммов Azotobacter vinelandii
геном Azotobacter vinelandii DJ organism:"Azotobacter vinelandii" AND organism:"DJ" 4991 По всей видимости, запрос выдал все белки нужного штамма бактерии
геном Azotobacter vinelandii DJ organism:"Azotobacter vinelandii" AND organism:"DJ" AND name:"ATP synthase" 16 Не уверена на счет названия... Но уже близко к правде
геном Azotobacter vinelandii DJ organism:"Azotobacter vinelandii" AND organism:"DJ" AND (name:"ATPase" or name:"ATP synthase") 44 Есть посторонние белки
геном Azotobacter vinelandii DJ organism:"Azotobacter vinelandii" AND organism:"DJ" AND gene:atp* 14 Похоже на правду

Скриншот результата поиска номер 1

Рис. 1. Скриншот результата поиска белков АТФ-синтазы бактерии Azotobacter vinelandii DJ

На рис. 1. показан результат последнего запроса поиска белков АТФ-синтазы бактерии Azotobacter vinelandii DJ. Fasta-файл из последовательностей найденных белков находится здесь.

АТФ-синтаза бактерии Azotobacter vinelandii CA6

Всего по запросу, описанному в таблицу 2 было найдено 14 белков АТФ-синтазы, все 14 находятся в базе данных TrEMBL. По доказательству существованию белка: 13 белков относится к "Inferred from homology" (выявлены из соображений гомологии), 1 белок относится к "Predicted" (предсказан, точных доказательств существования нет). Белки локализованы в разных локусах. Их можно разделить на две группы: 9 белков (AvCA6_52150 - AvCA6_52230) и 5 белков, которые находятся в совсем другом месте (AvCA6_19670 - AvCA6_19740). В целом, ситуация очень похожа на ситуацию в АТФазами Azotobacter vinelandii DJ.

Таблица 2. Запрос в Uniprot для поиска белков АТФ-синтазы Azotobacter vinelandii CA6

Геном или таксон Строка запроса Число записей Комментарии
геном Azotobacter vinelandii CA6 organism:"Azotobacter vinelandii" AND organism:"CA6" AND gene:atp* 14 Нужные белки найдены:)

Скриншот результата поиска номер 2

Рис. 2. Скриншот результата поиска белков АТФ-синтазы бактерии Azotobacter vinelandii CA6

На рис. 2. показан результат поиска белков АТФ-синтазы бактерии Azotobacter vinelandii CA6. Fasta-файл из последовательностей найденных белков находится здесь.

Поиск гомологов для одной из субъединиц АТФ-синтазы

Белки-гомологи — белки из разных организмов, гены которых с большой степенью вероятности имеют общее эволюционное происхождение. Вследствие того, что гены белков имеют общее эволюционное происхождение, последовательности этих белков должны быть в какой-то степени схожи. Для поиска гомологов субъединицы дельта АТФазы я использовала функцию BLAST (ищет белки по сходству последовательностей). Программа сформировала следующий запрос:

>sp|C1DND6|ATPD_AZOVD ATP synthase subunit delta OS=Azotobacter vinelandii (strain DJ / ATCC BAA-1303)
GN=atpH PE=3 SV=1
MINNQTLARPYAKAAFEYASAANGSDAWSGMLGLAAAVVEAPEVAELLRNPRLTRESKVE
AVLRLFADDVDEAFRNFIANLGEHDRLFVLPTVREQFEAYKAEAEKTIDVELETAYELSA
EQLETLAAALSKRLDRSVNPRQVVNPALIGGLVIRAGDLVVDGSVRGKLSQLAESLKS

В опциях поиска я задала максимальное количество результатов (500) и фильтр по таксономии (Gammaproteobacteria). Запрос выдал 499 белков, отсортированных в порядке схожести с исходным, из них 29 в Swiss-Prot и 470 в TrEMBL. Дальше я работала только с белками, лежащими в Swiss-Prot, т. к. они более изучены, но, к сожалению, среди них не оказалось белков с известной 3D-структурой. На рис. 3 показана страница Uniprot с выбранными находками. Fasta-файл из последовательностей десяти выбранных белков находится здесь.

Скриншот результата поиска гомологов

Рис. 3. Скриншот страницы с выбранными находками гомологов субъединицы дельта АТФ-синтазы Azotobacter vinelandii DJ

Поиск в NCBI

Далее было предложено выполнить аналогичные задания в базе данных NCBI. Я попыталась найти компотенты АТФ-синтазы бактерии Azotobacter vinelandii DJ. Запросы, выполненные в процессе поиска, приведены в таблице 3.

Таблица 3. Запросы в NCBI для поиска белков АТФ-синтазы Azotobacter vinelandii DJ

Строка запроса Число записей Комментарии
(Azotobacter vinelandii DJ[Organism]) AND atp*[Gene Name] 0 Видимо, как в Uniprot-е не получится... Возможно, дело в знаке "*", т. к. при его использовании NCBI ищет только первые 600 вариаций продолжения запроса. Скорее всего, среди них не было нужных нам запросов, поэтому поиск не дал результатов.
(Azotobacter vinelandii DJ[Organism]) AND ATP synthase 79 Явно есть лишние результаты, т. к. поисковик воспринимает "ATP" и "synthase" как два разных слова и ищет их по отдельности.
(Azotobacter vinelandii DJ[Organism]) AND "ATP synthase" 36 Уже ближе, но опять есть лишние записи, т. к. словосочетание "ATP synthase" ищется во всех полях, а не только в названии белка.
(Azotobacter vinelandii DJ[Organism]) AND ATP synthase[Protein Name] 0 Опять что-то не так. Видимо, для того, чтобы искать по имени белка, нужно вводить его имя полностью. Т. к. поиск не дал результатов, записей с названием "ATP synthase" в базе данных нет.
(Azotobacter vinelandii DJ[Organism]) AND ATP synthase[Title] 28 Вроде, то, что надо. Лишних результатов нет.

В базе Protein было найдено в два раза больше записей, чем в Uniprot, но среди них были повторяющиеся (записи с немного разными названиями, но описывающие один и тот же белок). Я повторила запрос в базе данных Gene. Было найдено 15 записей, на одну больше, чем в Uniprot. Результат почти сходен с результатом, полученным в Uniprot, за исключением того, что в Gene есть запись о белках H(+)-transporting ATP synthase, gene 1 из локуса Avin_19690 и F0F1 ATP synthase subunit C из локуса Avin_19720, которых нет в Uniprot. В Uniprot же, напротив, есть запись о белке ATP synthase subunit b из локуса Avin_19730, которого нет в Protein и Gene. Некоторые обнаруженные особенности особенности в принципе написания запросов в NCBI отображены в таблице 3, помимо этого, NCBI воспринимает написание названия организма вместе со штаммом (в отличие от Uniprot). Кнопка index в Advanced search показывает возможные варианты запроса, исходя из уже введенного сочетания букв, а также в скобках приводится количество находок по каждому такому варианту.

Протеом бактерии Azotobacter vinelandii DJ

Чтобы найти все белки протеома бактерии Azotobacter vinelandii DJ я ввела в Uniprot следующий запрос: organism:"Azotobacter vinelandii" AND organism:"DJ". Всего было найдено 4991 записей, из них в Swiss-Prot - 363 (по доказательству существования белка: Evidence at protein level - 4 записи; Inferred from homology - 359 записи), в TrEMBL - 4628 записи (Evidence at protein level - 6 записей; Inferred from homology - 964 записи; Predicted - 3658 записи). Можно сделать вывод, что бактерия более-менее изучена на молекулярном уровне, но всё же неизученных белков достаточно много. Таблицу с данными о белках протеома бактерии можно скачать здесь.

Чтобы получить информацию о белках, сходных с белками бактерии Azotobacter vinelandii DJ на 90% и 50% я использовала кнопки Redundancy 90% и 50%. В результате я получила список кластеров, состоящих из белков разных организмов, аминокислотные последовательности которых сходны на требуемое количество процентов. При нажатии кнопки Redundancy 90% найдено 4914 кластеров, в основном небольших, состоящих из гомологичных белков бактерий разных штаммов Azotobacter vinelandii DJ, т. е. очень близких организмов, но встречаются и большие кластеры (например, размером в 317 белка) из белков организмов того же порядка, что и моя бактерия. При нажатии кнопки Redundancy 50% найдено 4736 кластеров, некоторые из них очень большие (например, состоящие из 4579 белков), включают белки уже совсем дальних "родственников" бактерии Azotobacter vinelandii DJ.

©Shvetsova Ekaterina, FBB MSU, 2013
Дата последнего изменения: 07.12.2016