База данных Uniprot. Часть 2
Для освоения поиска в базе данных последовательностей белков Uniprot была проделана следующая работа:
- были найдены все белки - компоненты АТФ синтазы, закодированные в геномах бактерий Thermoanaerobacter Pseudethanolicus и
Thermoanaerobacter thermohydrosulfuricus;
- для одной из субъединиц АТФ-синтазы бактерий T. Pseudethanolicus найдены 10 гомологов в 10 других геномах.
Ниже представлены таблица выполненных запросов (таблица 1) и анализ результатов.
Таблица 1. Таблица запросов для поиска белков – компонентов АТФ-синтазы в Uniprot
№ |
Геном или таксон |
Строка запроса |
Число записей |
Комментарии |
1 |
Thermoanaerobacter pseudethanolicus strain ATCC 33223 |
organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" |
2,198 |
Общее количество записей соответствующее организму, полное название которого Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E)
(Clostridium thermohydrosulfuricum) |
2 |
Thermoanaerobacter pseudethanolicus strain ATCC 33223 |
organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" AND name:"ATP syntase" |
0 |
- |
3 |
Thermoanaerobacter pseudethanolicus strain ATCC 33223 |
organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" AND name:*atp* |
79 |
Много лишних вариантов. |
4 |
Thermoanaerobacter pseudethanolicus strain ATCC 33223 |
organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" AND gene:atp* |
4 |
То что надо. Подробнее смотри пункт 1. |
5 |
Thermoanaerobacter pseudethanolicus strain ATCC 33223 |
organism:"Thermoanaerobacter pseudethanolicus strain ATCC 33223" AND name:*atp* AND gene:22* |
10 |
8 из 10 генов найденных белков входят в оперон АТФ-синтазы. Подробнее смотри пункт 1. |
6 |
Thermoanaerobacter thermohydrosulfuricus |
organism:"Thermoanaerobacter thermohydrosulfuricus " AND gene:atp* |
7 |
Полное название организма Thermoanaerobacter thermohydrosulfuricus WC1. Подробнее смотри пункт 2. |
7 |
Thermoanaerobacter thermohydrosulfuricus |
organism:"Thermoanaerobacter thermohydrosulfuricus" AND name:*atp* AND gene:04* |
16 |
8 из 16 генов входят в оперон АТФ-синтазы. Подробнее смотри пункт 2. |
Анализ результатов
0. Первые три запроса не дали нужного результата.
1. Результатом четвертого запроса (см. таблицу 1) стало 4 белка — компонента АТФ-синтазы для бактерии Thermoanaerobacter thermohydrosulfuricus. Все четыре белка вошли в раздел Uniprot/Swissprot,
то есть были проверены экспертами. Более подробную информацию о каждом найденном белке, а именно : «Entry name», название кодирующего гена, из какого организма
белок получен, идентификатор этого организма и уровень доказательства существования белка, найдете здесь. Стоит обратить внимание, что все рассматриваемые белки
выведены из гомологии с другими белками. Вы можете скачать файл в формате fasta, содержащий последовательности аминокислотных остатков в белке.
Теперь обратимся к локализованности генов найденных белков. Они располагаются в следующих локусах: Teth39_2257, Teth39_2258, Teth39_2259, Teth39_2262.
Можно предположить, что эти гены входят в один оперон. Для поисках остальных генов оперона был вееден запрос №5 (см. таблицу 1), его рузультатом стали 10 белков,
гены восьми из которых располагаются в подряд идущих локусах: с Teth39_2257 по Teth39_2264. Данные гены сотавляют оперон АТФ-синтазы (данный оперон уже
рассматривался ранее).
Дополнительную информацию о белках оперона АТФ-синтазы найдете тут, также вы можете скачать файл в формате fasta с последовательностями аминокислот.
2. Далее мы искали компоненты АТФ-синтазы в геноме бактерии другого рода: Thermoanaerobacter thermohydrosulfuricus. Результатом запроса №6 (см. таблицу 1)
стало 7 белков, ни один из которых не входит в раздел Uniprot/Swissprot и каждый из которых выведен из гомологии. Вы можете посмотреть более
подробную информацию о белках
и скачать файл формата fasta с последовательностями аминокислот.
Аналогично рассмотренному ранее в пункте 1 обратим внимание на локусы генов найденных белков (TthWC1_0470, … , TthWC1_0475, TthWC1_0477) и
введем запрос №7 (см. таблицу 1). Результатом станет 16 белков. Помимо генов, уже найденных семи белков, в оперон АТФ-синтазы включим еще один ген
с локусом TthWC1_0476. Теперь информацию о белках оперона АТФ-синтазы бактерии T. Thermohydrosulfuricus смотрите здесь, а fasta-файл с последовательностями
аминокислот скачивайте тут.
3. Следующим действием мы стали искать гомологичные последовательности для одной из субъединиц АТФ-синтазы бактерии T. Pseudethanolicus, а именно для
субъединицы А. Это было сделано с помощью раздела «Blast». Мы выбрали 10 белков в основном из разных таксонов, разной длины и разной степени гомологичности,
аминокислотные последовательности которых вы можите скачать в файле формата fasta. В таблице 2 расположена некоторая информация о выбранных гомологах.
Ни для одного из выбранных белков структура неизвестна.
Таблица 2. Информация о гомологичных последовательностях для субъединицы А АТФ-синтазы бактерии T. Pseudethanolicus
|
Entry name |
Protein names |
Organism |
Organism ID |
Length |
Identity |
Gene names |
Первоначальный белок |
VATA_THEP3 |
V-type ATP synthase alpha chain (EC 3.6.3.14) (V-ATPase subunit A) |
Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E) (Clostridium thermohydrosulfuricum) |
340099 |
590 |
100% |
atpATeth39_2259 |
Гомологичные белки |
D3T6E5_THEIA |
V-type ATP synthase alpha chain |
Thermoanaerobacter italicus (strain DSM 9252 / Ab9) |
580331 |
590 |
97.0% |
atpA Thit_2333 |
D9RZY3_THEOJ |
V-type ATP synthase alpha chain |
Thermosediminibacter oceani (strain ATCC BAA-1034 / DSM 16646 / JW/IW-1228P) |
555079 |
590 |
92.0% |
atpA Toce_2042 |
VATA1_CLOTE |
V-type ATP synthase alpha chain 1 |
Clostridium tetani (strain Massachusetts / E88) |
212717 |
592 |
74.0% |
atpA1 CTC_00999 |
VATA_CLOTH |
V-type ATP synthase alpha chain |
Clostridium thermocellum (strain ATCC 27405 / DSM 1237) |
203119 |
589 |
73.0% |
atpA Cthe_2267 |
R6IV14_9FIRM |
V-type ATP synthase alpha chain |
Ruminococcus sp. CAG:177 |
1262952 |
590 |
71.0% |
atpA BN517_01831 |
C9L5A4_BLAHA |
V-type ATP synthase alpha chain |
Blautia hansenii DSM 20583 |
537007 |
588 |
70.0% |
atpABLAHAN_04554 |
D0GLF4_9FUSO |
V-type ATP synthase alpha chain |
Leptotrichia goodfellowii F0264 |
596323 |
590 |
69.0% |
ntpA atpA HMPREF0554_0858 |
D6BI20_FUSNU |
V-type ATP synthase alpha chain |
Fusobacterium nucleatum subsp. animalis D11 |
556264 |
589 |
69.0% |
atpA PSAG_01853 |
R6M982_9FIRM |
V-type ATP synthase alpha chain |
Acidaminococcus intestini CAG:325 |
1263033 |
590 |
68.0% |
atpA BN610_00668 |
B0P7V8_9FIRM |
V-type ATP synthase alpha chain |
Anaerotruncus colihominis DSM 17241 |
445972 |
590 |
67.0% |
atpA ANACOL_00847 |