Практикумы 7-12 |
|
7. Определение вторичной структурыДля выполнения задания была взята структура с идентификатором 5DBQ, соответствующая
тиоредоксину. В ней имеется 4 α-спирали и 4 β-тяжа разной длины.
В отличие от третичной, вторичная структура предсказывается достаточно хорошо,
для ее предсказания написаны такие программы, как, например, DSSP и Stride. mkdssp -i 5dbq.pdb -o 5dbq.dssp stride -h 5dbq.pdb -f5dbq.stride они были запущены и было получено два файла с выдачей:
для DSSP и для Stride. Таблица 1. Сравнение разметок из PDB и полученных программами DSSP и Stride
В принципе, предсказания получились хорошие, β-тяжи предсказываются немного лучше, чем α-спирали; программа Stride дает немного более близкие к исходной разметке предсказания, хотя для таких утверждений статистики явно недостаточно. Также следует отметить, что выдача Stride более удобна и проста для восприятия и парсинга. 8. Совмещение структур. 3D поискПоиск сруктурных гомологов белкаДля выполнения задания была выбрана структура белка крамбина с идентификатором 3NIR, для которой сервис PDBeFold находит 491 структурных гомологов. Из них было выбрано 4 не очень близких, но и не очень дальних гомолога: 1BHP:A Q=0.83 RMSD=0.83 %seq=32 2PLH:A Q=0.83 RMSD=0.87 %seq=32 3SZS:E Q=0.83 RMSD=0.99 %seq=31 2EYC:A Q=0.67 RMSD=1.81 %seq=93 Выравнивание структурных гомологовЭти структуры были использованы для построения структурного выравнивания и выравнивания последовательностей (рис. 1, рис.2). ![]() Рисунок 1. Структурное выравнивание выбранных последовательностей. ![]() Рисунок 2. (Сверху) выравнивание последовательностей выбранных структур алгоритмом MUSCLE. (Снизу) Выравнивание, полученное по структуре. Сравним два полученных выравнивания (рис. 2). Можно заметить, что они очень похожи, но у структурное выравнивание менее блочное. Обратим внимание на колонку с номером 20. В структурном выравнивании там стоят аргинины, глицины и пролин, которые действительно расположены близко в пространстве в пространстве (рис. 3). В выравнивании последовательностей, эта колонка занята исключительно глицинами. Теперь посмотрим на расположение этих остатков в пространстве (рис. 3). ![]() Рисунок 3. Расположение двадцатых глицинов (выделены серым) на структурном выравнивании. Из этого рисунка видно, что глицины образуют начало петель, соединяющих альфа-спирали, что и является частой фунцией глицина в структуре. Этот факт, а также то, что структурное выравнивание на этом участке не позволяет сделать однозначный вывод, наводит на вывод, что в данном случае лучше сработало выравнивание последовательностей. Сравнение гибкого и жесткого выравниванияВ статье, описывающей алгоритм FATCAT, говорится, что в среднем гибкое совмещение дает выравнивание большей длины. Одним из ярчаших примеров этого преимущества является пара структур 1AJ3 и 2SPC, отличие которых заключается в одной мутации в середине альфа-спирали 2SPC, которая создает в этом месте петлю. В результате, жесткое совмещение не выравнивает половину этой спирали, в то время как гибкое с этой задачей справляется. Сервис PDBeFold дает Z-score выравнивания 2.5 и P-value 0.006, в то время, как FATCAT дает P-value 1.93e-06, что гораздо лучше. Причиной, может являться то, что FATCAT вносит петлю в середину длинной альфа-спирали и сгибает ее, улучшая таким образом качество выравнивания. 9. Гидрофобные кластерыПоиск гидрофобных кластеровС помощью сервиса CluD можно находить гидрофобные кластеры в структуре белка. Рассмотрим структуру белка крамбина с идентификатором 3NIR. Известно (см. практикум 1), что крамбин -- это плотный белок, единственной функцией которого является образование плотных кристаллов, в которых запасается энергия и аминокислоты. Поэтому можно ожидать, что в крамбине будет всего один гидрофобный кластер. Меняя параметр порогового расстояния в сервисе CluD, Можно изучить поподробнее свойства ядра крамбина (рис. 4). ![]() Рисунок 4. Гидрофобные кластеры в крамбине при разных значениях параметра порога расстояния. Как мне кажется, наиболее правдоподобные картины получились при значениях 5.4 и 6.5 Ангстрем. При больших значениях частью кластера становятся сильно отдаленные аминокислоты участков, явно выступающих в раствор, а при меньших значениях кластеры распадаются на мелкие части, которые визуально должны быть связаны. Визуально кажется, что значение в 6.5 Ангстрем оказалось удачнее параметра по умолчанию, так как бета-лист, очевидно входящий в центральный гидрофобный кластер, при таком пороге не разделяет его на две части. Гидрофобные кластеры в структуре взаимодействия ДНК-белокТеперь посмотрим на гидрофобные кластеры в комплексе ДНК с белком. Для выполнения задания была использована уже рассматривавшееся структура 3HDD. ![]() Рисунок 5. Гидрофобные кластеры в структуре 3HDD при разных значениях параметра порога расстояния. Можно заметить, что в данном случае не наблюдается какой-то специальной гидрофобной области контакта белка с ДНК. Впрочим, контакт достаточно плотный, и при повышении порога кластеры ДНК и белка сливаются. 10. Поверхность белкаДля выполнения задания была выбрана структура с идентификатором 1QP0, отвечающая операторному комплексу палиндромного гипоксантинового рецептора кишечной палочки. В начале, с помощью операций симметрии, была восстановлена "вторая половина" PDB-файла, то есть была воспроизведена биологическая единица. На рисунке 6 Показана поверхность контакта мономеров белка в активном димере. ![]() Рисунок 6. Поверхность контакта мономеров белка в активном димере пуринового репрессора. На рисунке 7 показана поверхность контакта белка с ДНК и на рисунке 8 показана та же картина, только молекула ДНК изображена в форме палочек (sticks). ![]() Рисунок 7. Поверхность контакта пуринового репрессора c ДНК. ![]() Рисунок 8. Поверхность контакта пуринового репрессора c ДНК. ![]() Рисунок 9. Поверхность контакта мономеров белка в активном димере пуринового репрессора. Красным отмечены области, входящие в гидрофобные кластеры. Далее была запущена программа CluD с параметрами максимального расстояния 5.4 Ангстрема и минимального размера кластера 10 атомов. Таким путем было найдено 6 кластеров в одном мономере. С помощью скрипта, переводящего скрипты RasMol в скрипты PyMOL, была сгенерирована последовательность команд, выделяющих гидрофобные кластеры, найденные CluD, в белке. На рисунке 9 изображена поверхность контакта мономеров, раскрашенная по принадлежности к гидрофобным кластерам. Можно заметить гидрофобные контакты между мономерами вблизи ДНК. 11. Структурная классификацияДля выполнения задания была выбрана структура с идентификатором 1L7V, и для нее был проведен поиск границ доменов в четырех базах: SCOP, PFAM, ECOD и CATH. Результаты Для одного из доменов -- укладки АВС-транспортера типа II, представлены в таблице 2. Таблица 2. Границы домена АВС-транспортера типа II в базах SCOP, PFAM, ECOD и CATH
Можно заметить, что базы SCOP, ECOD и CATH дают практически идентичный результат, в то время, как начало домена согласно базе Pfam сдвинуто в сторону середины белка. Однако в целом все базы дают очень похожие результаты. 12. Поиск в PDBВозможности Advanced SearchБыл сформулирован запрос в Advanced search базы данных PDB на структуры, разрешенные РСА с разрешением от 2.5 до 5 Ангстрем. Также структуры должны были иметь свободные лиганды, быть дикого типа (не мутанты), иметь длину между 100 и 150 аминокислот и принадлежать кишечной палочке. Полный текст запроса: Resolution is between 2.5 and 5.0 and Ligand Search : Has free ligands=yes and Percent Sequence Alignment Search : PDB can contain Expression Tag sequence = Yes , and Sequence Length is between 100 and 150 and Taxonomy is just Escherichia coli (E. coli) Далее, с помощью опции custom report, была сгенерирована Excel-таблица с результатами поиска. Также был скачен файл со всеми последовательностями и файл с идентификаторами. Таблица филаментовДалее, опять же с помощью опции Advanced search, был получен список структур филаментов, определенных методом электронной микроскопии. Текст запроса: Text Search for: filament and Holdings : Molecule Type=ignore Experimental Method=ELECTRON MICROSCOPY Далее, фильтрацией записей в Custom report, был получен файл, содержащий записи только о белках со сходством выше 50% остатков. |
© Михаил Молдован, 2013 (Последнее исправление: 27.10.2016)