Зачётное задание

Работа выполняется в течение 90 мин. (академической пары). Все файлы с результатами к окончанию этого периода должны лежать в директории H:\Term2\Block3\CW . Файлы скачиваются автоматически, поэтому следите, чтобы в названии директории не было опечаток!

Исходный материал лежит на диске P в директории P:\y11\Term2\Block3\CW, в файле xxxxx.fasta , где xxxxx — ваше пользовательское имя на kodomo.

Отчёт можно писать в простом текстовом формате, Word'е или в HTML; соответственно, файл с отчётом должен называться "report.txt", "report.docx", "report.rtf" или "report.html". Зачётные файлы: отчёт, файл с выравниванием в fasta-формате (задача 3), файл с проектом JalView (задача 5). Промежуточные файлы (копию исходного материала, невыровненные последовательности и т.п.) не удаляйте (кроме ошибочных). По всем задачам, кроме пятой, отчёт должен включать формулировки вопросов, на которые вы отвечаете, и ответы на них.

Задача 1.

Определите, фрагментом какого белка из банка Swiss-Prot является данная последовательность. Укажите в отчёте: ID в текущем релизе, все AC, рекомендуемое полное название (по-английски), из какого организма белок. Укажите также координаты (начало-конец) данного фрагмента в полноразмерном белке и какие особенности указаны в поле FT записи Swiss-Prot для частей последовательности, пересекающихся с данным фрагментом (в том числе, включающих его или входящих в него).

Задача 2.

Определите PDB-код пространственной структуры белка, содержащего возможно более близкий по последовательности (среди белков с известной структурой) к данному фрагменту участок. Приведите в отчёте код, идентификатор цепи в PDB и выравнивание исходного фрагмента и последовательности, представленной в PDB.

Подсказка. BLAST по банку PDB. Вставляя выравнивание в отчёт, не забудьте, что в Word'е оно должно быть представлено шрифтом постоянной ширины (например, Courier New), а в HTML представлять собой преформатированный текст (то есть быть обрамлённым тэгами "<PRE>" и "</PRE>").

Задача 3.

Подберите 4–5 гомологов полноразмерного (т.е., найденного при выполнении задачи 1) белка в банке Swiss-Prot, находящихся на разном эволюционном расстоянии от него (об эволюционном расстоянии будем в первом приближении судить по Bit score). Постройте полное множественное выравнивание белка и его отобранных гомологов (файл alignment.fasta или alignment.fa в fasta-формате). В отчёте приведите список гомологов и какой программой вы пользовались для получения выравнивания.

Указание. Гомологами считать находки с E-value не хуже 0,001.

Задача 4.

Определите, какие эволюционные домены (согласно банку Pfam) имеются в белке, фрагментом которого является исходная последовательность. С каким из доменов пересекается фрагмент?

Задача 5.

Откройте выравнивание, полученное при выполнении задачи 3, в JalView. Разметьте выравнивание следующим образом: тот эволюционный домен, с которым пересекается исходный фрагмент, и всё, что выровнялось с ним, покрасьте по консервативности (BLOSUM62 и Conservation с уровнем 60%), остальное оставьте нераскрашенным. Сохраните проект JalView (файл с расширением jar). Эту задачу описывать в отчёте не надо, результатом является jar-файл.

Подсказка. Сначала снимите раскраску (если она была) со всего выравнивания (меню Colour), затем найдите и покрасьте нужный блок. В JalView, чтобы покрасить блок выравнивания, надо выделить его мышью, затем щёлкнуть по нему правой кнопкой мыши и выбрать Selection → Group → Group Colour.