Для выполнения заданий практикума были выбраны белки с мнемоникой "TDCD_", которая обозначает пропионаткиназу. Она катализирует превращение пропионилфосфата и АДФ в пропионат и АТФ. Также он может использовать ацетилфосфат в качестве акцептора фосфатной группы.
Всего в банке белковых последовательностей бактерий Swiss-Prot было найдено 12 белков с такой мнемоникой. Для поиска использовалась следующая команда на bash:
grep -c "TDCD_" /P/y24/term4/bacteria-sw.fasta
Далее проводилось выравнивание для первых 8 последовательностей, выбранных из списка всех найденных белков. Названия выбранных белков: TDCD_ECOLI, TDCD_SALTY, TDCD_YERE8, TDCD_ENT38, TDCD_CITK8, TDCD_SALA4, TDCD_KLEV3, TDCD_SALTD.
По результатам поиска были найдены все 12 белков с выбранной мнемоникой, содержащих данный мотив, представленный в виде паттерна. Соответственно, количество ложноотрицательных находок составило 0.
Поиск мотивов в белках программой MEME и поиск этих мотивов в банке
Также был произведен поиск мотивов программой MEME со следующими опциями: аминокислотные последовательности, по одному представителю мотива на последовательность, минимальная длина мотива 8, максимальная длина мотива 15 остатков, не более трёх мотивов на выравнивание:
На выходе была получена директория meme_out, содержащая файл meme.html. По результатам работы программы было найдено 3 мотива во всех выбранных белках с мнемоникой