Практикум №8. Мотивы и формы их представления.

Описание мотива белка паттерном

Для выполнения заданий практикума были выбраны белки с мнемоникой "TDCD_", которая обозначает пропионаткиназу. Она катализирует превращение пропионилфосфата и АДФ в пропионат и АТФ. Также он может использовать ацетилфосфат в качестве акцептора фосфатной группы.

Всего в банке белковых последовательностей бактерий Swiss-Prot было найдено 12 белков с такой мнемоникой. Для поиска использовалась следующая команда на bash:

grep -c "TDCD_" /P/y24/term4/bacteria-sw.fasta

Далее проводилось выравнивание для первых 8 последовательностей, выбранных из списка всех найденных белков. Названия выбранных белков: TDCD_ECOLI, TDCD_SALTY, TDCD_YERE8, TDCD_ENT38, TDCD_CITK8, TDCD_SALA4, TDCD_KLEV3, TDCD_SALTD.

Файл с выравниванием

С помощью команды fuzzpro по полученному паттерну производился поиск в банке белковых последовательностей бактерий из Swiss-Prot:

Для создания паттерна был выбран участок выравнивания с 320 по 330 позицию (11 позиций). Затем по выбранному мотиву был составлен следующий паттерн:

"S-V-D-T-S-M-G-M-G-M-T-P-L-E-G-L-[MIV]-M-G--T-R"

fuzzpro -sequence /P/y24/term4/bacteria-sw.fasta -pattern "[GA]-[ILV]-[IV]-F-T-G-G-I-G-E-N" -outfile results_TDCD.fuzzpro

По результатам поиска были найдены все 12 белков с выбранной мнемоникой, содержащих данный мотив, представленный в виде паттерна. Соответственно, количество ложноотрицательных находок составило 0.

Поиск мотивов в белках программой MEME и поиск этих мотивов в банке

Также был произведен поиск мотивов программой MEME со следующими опциями: аминокислотные последовательности, по одному представителю мотива на последовательность, минимальная длина мотива 8, максимальная длина мотива 15 остатков, не более трёх мотивов на выравнивание:

meme TDCD_sequences.fasta -protein -minw 8 -maxw 15 -mod oops -nmotifs 3

На выходе была получена директория meme_out, содержащая файл meme.html. По результатам работы программы было найдено 3 мотива во всех выбранных белках с мнемоникой