Множественное выравнивание гомологов белка THIE_BACSU




Создание репрезентативной выборки гомологов белка THIE_BACSU


Белок THIE_BACSU принадлежит к организму, полное название которого Bacillus subtilis subsp. subtilis str. 168, он в свою очередь принадлежит филуму Firmicutes. Нашей целью являлось создание выборки гомологов данного белка из различных групп прокариот и эукариот по отдельности. Для первого поиска гомологов был использован алгоритм BLASTP и база данных RefSeq. Из параметров поиска были исключены все эукариоты и все представители филума Firmicutes, а для второго поиск только по эукариотам, все остальные параметры сохранены соответственно. Данные, описывающие параметры поиска и результаты приведены в Таблице 1.

Таблица 1. Финальные параметры поиска BLAST

Поиск Алгоритм BLAST Название базы данных Ограничения по таксонам Порог e-value Максимальное количество хитов
По прокариотам BLASTP Reference proteins кроме Firmicutes и Eukaryota 10-5 500
По эукариотам BLASTP Reference proteins Eukaryota 10-5 500


Поиск по прокариотам
После осуществления поиска с заданными параметрами был получен 441 хит с помощью алгоритма BLASTP, после чего по этим хитам была получена сводка (дерево/cписок) GenPept (база данных GenBank), которая представлена ниже (рис.1). Затем из данных находок были отобраны 20, отбор производился таким образом, чтобы охватить как можно больше различных групп. Результаты представлены в таблице 2.
Рисунок 1. Дерево, показывющие таксономию найденных хитов. Щелкая по названиям таксонов, можно получить хиты, которые им принадлежат; в скобках после таксона указано количество хитов.


Поиск по эукариотам
После осуществления поиска с заданными параметрами было получено 109 хитов, дальнейшие действия выполнены аналогично поиску по прокариотам (рис.2).
Рисунок 2.Дерево, показывающее таксономию найденных хитов. Щелкая по названиям таксонов, можно получить хиты, которые им принадлежат; в скобках после таксона указано количество хитов.


Таблица 2. Встречаемость белков в различных таксонах

Домен Филум/Царство Название организма Идентификатор белка
Bacteria Actinobacteria Rubrobacter xylanophilus DSM 9941 YP_645514.1
Aquificales Sulfurihydrogenibium yellowstonense SS-5 ZP_04585372.1
CFB group bacteria Dysgonomonas gadei ATCC BAA-286 ZP_08474472.1
Cyanobacteria Cyanobacterium UCYN-A YP_003421317.1
Cyanothece sp. ATCC 51472 ZP_08971450.1
Fibrobacterales Fibrobacter succinogenes subsp. succinogenes S85 YP_003250976.1
Firmicutes

Bacillus subtilis subsp. subtilis str. 168

THIE_BACSU
Fusobacteria Fusobacterium mortiferum ATCC 9817 ZP_08688930.1
GNS Bacteria Chloroflexus aggregans DSM 9485 YP_002464460.1
Green sulfur bacteria Pelodictyon phaeoclathratiforme BU-1 YP_002018367.1
Planctomycetes Planctomycete KSU-1 ZP_10099894.1
Proteobacteria(b) Oxalobacter formigenes HOxBLS ZP_04577479.1
Taylorella asinigenitalis 14/45 YP_007821950.1
Proteobacteria(d) Desulfovibrio africanus str. Walvis Bay YP_005051000.1
Geobacter sp. M21 YP_003023307.1
Proteobacteria(e) Helicobacter pylori WP_000920263.1
Proteobacteria(g) Haemophilus parainfluenzae T3T1 YP_004822837.1
Oceanimonas sp. GK1 YP_005090835.1
Spirochetes Treponema sp. JC4 ZP_10009625.1
Synergistales Aminobacterium colombiense DSM 12261 YP_003553126.1
Verrucomicrobia Akkermansia muciniphila ATCC BAA-835 YP_001878606.1
Eukaryotes Acanthamoeba Acanthamoeba castellanii str. Neff XP_004339451.1
Animals Trichoplax adhaerens XP_002119014.1
Xenopus (Silurana) tropicalis XP_002945542.1
Diatoms Phaeodactylum tricornutum CCAP 1055/1 XP_002181508.1
Thalassiosira pseudonana CCMP1335 XP_002296743.1
Fungi(Ascomycetes) Aspergillus terreus NIH2624 XP_001218501.1
Candida tropicalis MYA-3404 XP_002548262.1
Clavispora lusitaniae ATCC 42720 XP_002616281.1
Coccidioides immitis RS XP_001247027.1
Lodderomyces elongisporus NRRL YB-4239 XP_001527174.1
Saccharomyces cerevisiae S288c NP_015110.1
Sordaria macrospora k-hell XP_003350552.1
Fungi(Basidiomycetes) Cryptococcus gattii WM276 XP_003195828.1
Green plants Arabidopsis thaliana NP_173707.2
Cucumis sativus XP_004160527.1
Physcomitrella patens subsp. patens XP_001773462.1
Selaginella moellendorffii XP_002991097.1
Volvox carteri f. nagariensis XP_002948683.1
Perkinsida Perkinsus marinus ATCC 50983 XP_002776141.1
Schizopyrenida Naegleria gruberi XP_002682430.1
В царстве Архей не нашлось ни одного организма :'(
Последовательности в FASTA-формате можно посмотреть здесь.

Множественное выравнивание гомологов белка THIE_BACSU


После составления выборки, с помощью программы MUSCLE было построено множественное выравнивание (рис.3).

Рисунок 3. Множественное выравнивание последовательности белка THIE_BACSU и его гомологов. Окраска стандартной цветовой гаммой Clustalx. Исходный белок выделен серым.

Далее был произведен анализ множественного выравнивания средствами JalView. Последовательность изучаемого белка была проассоциирована с соответстующим ей PDB-файлом. Затем к исходному выравниванию были добавлены 3 новые строки аннотаций (рис.4):
BLOCKS: показывает, относительно консервативные участки или так называемые "блоки". В строке BLOCKS напротив нужной аминокислоты стоит буква "В".
LIGANDS: показывает, какие остатки связаны с лигандом. В строке LIGANDS напротив нужного остатка стоит буква "L".
SECONDARY: показывает, какие из остатков формируют элементы вторичной структуры, такие как, бета-тяжи и альфа-спирали.

Рисунок 4. Множественное выравнивание последовательности белка THIE_BACSU и его гомологов с добавленными аннотациями. Исходный белок находится в самой нижней строчке.

К сожалению, было выявлено несоотвествие нумерациии остатков между последовательностью белка THIE_BACSU и проассоциированной с ней 3D-структурой (рис.5). Поэтому номера остатков, связанных с лигандом написаны через дробь: первым стоит его номер в последовательности, а вторым - в 3D-структуре (рис.6, 7).

Рисунок 5. Парное выравнивание исходной последовательности белка THIE_BACSU и последовательности, за которой стоит данная 3D-структура (доказательство сдвига в нумерации).

Результаты анализа множественного выравнивания гомологов белка THIE_BACSU


Рисунок 6. Расположение двух остатков аспарта, связывающих лиганд со структурой. Остатки окрашены в розовый и зеленый, лиганд - в синий. Ко всем трем применена команда wireframe 100, а к лиганду еще и cpk 70.
Рисунок 7. Расположение двух остатков аспарта, связывающих лиганд со структурой крупным планом.


© Novikova Maria, 2013
Последнее обновление: 06.05.2013