Вернуться на страницу семестров
D6 (использование сайта PDB)
Задание 1. Скачайте все последовательности белков, структуры которых определены при помощи метода электронной микроскопии, в виде одного FASTA файла. Используйте Advances search.
Рисунок 1. Результаты поиска "Advances search".
Все последовательности, структуры которых определены при помощи метода электронной микроскопии
Вывод: было обнаружено 924 структуры. Следует отметить, что некоторые из них могут повторяться (например, одна и та же структура, но одна с лигандом, а другая без). Были также получены все последовательности этих структур в один fasta-файл.
Задание 2. Сравните список структурных гомологов, определенных для вашего белка программой PDBeFold с таким же списком из программы jFATCAT. Последний список есть прямо на странице PDB
1) В PDB, для белка 3OES, была выполнена работа алгоритма jFATCAT. Пройдя по ссылки "Structure Similarity", увидел, что jFATCAT искал гомологов не для ГТФазы RhebL1, c PDB-кодом 3OES, а для другой структуры с PDB-кодом 2CE2 (для цепи Х), с которой более чем на 40 % идентичны последовательности. Для этой структуры было найдено 369 гомологов (при р-value < 0.001) .
2) Далее провел поиск в PDBeFold для предложенного белка 2CE2 (для цепи Х). Выбрал параметр "best matches only" и порог на сходство структур 70%. Это хоть как-то приближало к поиску с помощью jFATCAT (где показываются результаты с р-value < 0.001). Было найдено 1252 структур. Ниже ссылка на файл из PDBeFold с результатми поиска.
Выдача PDBeFold для белка 2CE2 (порог на сходство структур 70%)
Вывод: PDBeFold дал больше результатов, чем jFATCAT. На самом деле, это немного не то, что я ожидал, поскольку был уверен в том, что гибкое выравнивание дает некое преимущества по сравнению с жестким при поиске гомологов.