Учебный сайт Алены Корягиной

База данных Uniprot. Часть 2

Для освоения поиска в базе данных последовательностей белков Uniprot была проделана следующая работа:

  • были найдены все белки - компоненты АТФ синтазы, закодированные в геномах бактерий Thermoanaerobacter Pseudethanolicus и Thermoanaerobacter thermohydrosulfuricus;
  • для одной из субъединиц АТФ-синтазы бактерий T. Pseudethanolicus найдены 10 гомологов в 10 других геномах.
Ниже представлены таблица выполненных запросов (таблица 1) и анализ результатов.

Таблица 1. Таблица запросов для поиска белков – компонентов АТФ-синтазы в Uniprot

Геном или таксон Строка запроса Число записей Комментарии
1 Thermoanaerobacter pseudethanolicus strain ATCC 33223

organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" 2,198 Общее количество записей соответствующее организму, полное название которого Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E) (Clostridium thermohydrosulfuricum)
2 Thermoanaerobacter pseudethanolicus strain ATCC 33223

organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" AND name:"ATP syntase" 0 -
3 Thermoanaerobacter pseudethanolicus strain ATCC 33223

organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" AND name:*atp* 79 Много лишних вариантов.
4 Thermoanaerobacter pseudethanolicus strain ATCC 33223

organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" AND gene:atp* 4 То что надо. Подробнее смотри пункт 1.
5 Thermoanaerobacter pseudethanolicus strain ATCC 33223

organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" AND name:*atp* AND gene:22* 10 8 из 10 генов найденных белков входят в оперон АТФ-синтазы. Подробнее смотри пункт 1.
6 Thermoanaerobacter thermohydrosulfuricus

organism:"Thermoanaerobacter thermohydrosulfuricus " AND gene:atp* 7 Полное название организма Thermoanaerobacter thermohydrosulfuricus WC1. Подробнее смотри пункт 2.
7 Thermoanaerobacter thermohydrosulfuricus

organism:"Thermoanaerobacter thermohydrosulfuricus" AND name:*atp* AND gene:04* 16 8 из 16 генов входят в оперон АТФ-синтазы. Подробнее смотри пункт 2.

Анализ результатов

0. Первые три запроса не дали нужного результата.

1. Результатом четвертого запроса (см. таблицу 1) стало 4 белка — компонента АТФ-синтазы для бактерии Thermoanaerobacter thermohydrosulfuricus. Все четыре белка вошли в раздел Uniprot/Swissprot, то есть были проверены экспертами. Более подробную информацию о каждом найденном белке, а именно : «Entry name», название кодирующего гена, из какого организма белок получен, идентификатор этого организма и уровень доказательства существования белка, найдете здесь. Стоит обратить внимание, что все рассматриваемые белки выведены из гомологии с другими белками. Вы можете скачать файл в формате fasta, содержащий последовательности аминокислотных остатков в белке. Теперь обратимся к локализованности генов найденных белков. Они располагаются в следующих локусах: Teth39_2257, Teth39_2258, Teth39_2259, Teth39_2262. Можно предположить, что эти гены входят в один оперон. Для поисках остальных генов оперона был вееден запрос №5 (см. таблицу 1), его рузультатом стали 10 белков, гены восьми из которых располагаются в подряд идущих локусах: с Teth39_2257 по Teth39_2264. Данные гены сотавляют оперон АТФ-синтазы (данный оперон уже рассматривался ранее). Дополнительную информацию о белках оперона АТФ-синтазы найдете тут, также вы можете скачать файл в формате fasta с последовательностями аминокислот.

2. Далее мы искали компоненты АТФ-синтазы в геноме бактерии другого рода: Thermoanaerobacter thermohydrosulfuricus. Результатом запроса №6 (см. таблицу 1) стало 7 белков, ни один из которых не входит в раздел Uniprot/Swissprot и каждый из которых выведен из гомологии. Вы можете посмотреть более подробную информацию о белках и скачать файл формата fasta с последовательностями аминокислот.

Аналогично рассмотренному ранее в пункте 1 обратим внимание на локусы генов найденных белков (TthWC1_0470, … , TthWC1_0475, TthWC1_0477) и введем запрос №7 (см. таблицу 1). Результатом станет 16 белков. Помимо генов, уже найденных семи белков, в оперон АТФ-синтазы включим еще один ген с локусом TthWC1_0476. Теперь информацию о белках оперона АТФ-синтазы бактерии T. Thermohydrosulfuricus смотрите здесь, а fasta-файл с последовательностями аминокислот скачивайте тут.

3. Следующим действием мы стали искать гомологичные последовательности для одной из субъединиц АТФ-синтазы бактерии T. Pseudethanolicus, а именно для субъединицы А. Это было сделано с помощью раздела «Blast». Мы выбрали 10 белков в основном из разных таксонов, разной длины и разной степени гомологичности, аминокислотные последовательности которых вы можите скачать в файле формата fasta. В таблице 2 расположена некоторая информация о выбранных гомологах. Ни для одного из выбранных белков структура неизвестна.

Таблица 2. Информация о гомологичных последовательностях для субъединицы А АТФ-синтазы бактерии T. Pseudethanolicus

Entry name Protein names Organism Organism ID Length Identity Gene names
Первоначальный белок VATA_THEP3 V-type ATP synthase alpha chain (EC 3.6.3.14) (V-ATPase subunit A) Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E) (Clostridium thermohydrosulfuricum) 340099 590 100% atpATeth39_2259
Гомологичные белки D3T6E5_THEIA V-type ATP synthase alpha chain Thermoanaerobacter italicus (strain DSM 9252 / Ab9) 580331 590 97.0% atpA Thit_2333
D9RZY3_THEOJ V-type ATP synthase alpha chain Thermosediminibacter oceani (strain ATCC BAA-1034 / DSM 16646 / JW/IW-1228P) 555079 590 92.0% atpA Toce_2042
VATA1_CLOTE V-type ATP synthase alpha chain 1 Clostridium tetani (strain Massachusetts / E88) 212717 592 74.0% atpA1 CTC_00999
VATA_CLOTH V-type ATP synthase alpha chain Clostridium thermocellum (strain ATCC 27405 / DSM 1237) 203119 589 73.0% atpA Cthe_2267
R6IV14_9FIRM V-type ATP synthase alpha chain Ruminococcus sp. CAG:177 1262952 590 71.0% atpA BN517_01831
C9L5A4_BLAHA V-type ATP synthase alpha chain Blautia hansenii DSM 20583 537007 588 70.0% atpABLAHAN_04554
D0GLF4_9FUSO V-type ATP synthase alpha chain Leptotrichia goodfellowii F0264 596323 590 69.0% ntpA atpA HMPREF0554_0858
D6BI20_FUSNU V-type ATP synthase alpha chain Fusobacterium nucleatum subsp. animalis D11 556264 589 69.0% atpA PSAG_01853
R6M982_9FIRM V-type ATP synthase alpha chain Acidaminococcus intestini CAG:325 1263033 590 68.0% atpA BN610_00668
B0P7V8_9FIRM V-type ATP synthase alpha chain Anaerotruncus colihominis DSM 17241 445972 590 67.0% atpA ANACOL_00847
© Alyona Koryagina aakor@fbb.msu.ru

Дата последнего изменения: 29.05.2014