Учебная страница курса биоинформатики,
год поступления 2013
Использование сервисов PDB
1. Продемонстрируйте владение возможностями Abvanced Search
a. Получить таблицу Excel с информацией о всех PDB файлах, удовлетворяющих нескольким (>= 2) критериям.
Критерии на
- метод решения структуры, разрешение - для РСА
- название белка
- наличие в файле определенного или любого лиганда, ДНК, РНК
- сходство с данной последовательностью (BLAST)
- организм
- ... и много-много-много других
Задайте свой список колонок с информацией!
Используйте Custom Report. Бывают проблемы с браузерами, используйте Mozilla.
b. Получить последовательности белков, удовлетворяющих критериям, в одном fasta-файле.
c. Получить структуры белков, удовлетворяющих критериям
В отчёте: запрос, минимальное объяснение для проверяющих и ссылки на файлы с результатами.
Как выбрать критерии: лучший вариант - выбрать самостоятельно для интересных вам белков. Допустимо использовать пример ниже. Следите, чтобы найденных PDB-кодов было не слишком много!
1a. (ААл) Получите Excel таблицу структур филаментов, определенных при помощи метода электронной микроскопии
Отфильтруйте так, чтобы не оставалось белков со сходством выше 50% идентичных остатков. В таблице должны быть указаны: PDB код; название структуры; метод решения; разрешение и разрешение метода EM; классификация; главная публикация. Используйте Advances search.
1b. (ЕА) Скачайте все последовательности белков, структуры которых определенны при помощи метода электронной микроскопии
в виде одного FASTA файла. Используйте Advances search.
1c. (ААл) Скачайте все файлы, полученные в 1a. Если их многовато, то добавьте критерий на организм
2a.*(дополнительное) (ЕА) Напишите программу, которая скачивает pdb файлы с указанными ID
Найдите на сайте PDB ссылки на FTP хранилище файлов. Напишите программу на любом языке программирования (bash, python, etc), которая скачивает pdb файл по указанному ID. Можно использовать вызовы стандартных программ Linux. Учтите, что некоторые файлы помечены как obsolete. Желательно, чтобы ваш скрипт предупреждал об этом пользователя.
2b.*(дополнительное) Добавьте в ваш скрипт возможность автоматически получить не только целый PDB файл, но и какую-либо его часть
(на выбор: указанную цепочку или несколько, указанный участок цепи, все белковые цепочки, структуру без молекул воды или низкомолекулярных лигандов, восстановленную биологическую единицу или часть кристалла, иное).