Последовательность Шайна-Дальгарно. На небольшом расстоянии от стартового кодона у бактерий находится последовательность, узнаваемая 3'-концом 16S РНК, что вызывает начало трансляции. Задачи: отобрать из генома бактерии достоверные(длиннее 100 а.о.) последовательности генов, включая 20 нуклеотидов до начала трансляции; найти среди их части и 3'-конца 16S РНК с помощью программы MEME последовательности SD и ASD(точнее из найденных мотивов выбрать именно их); на оставшихся генах с помощью программы FIMO протестировать работу построенной PWM Отбор входных последовательностей. Для выполнения задания был выбран геном штамма бактерии Streptomyces subrutilus, обзор на который выполнялся в первом семестре. Из сопроводительных материалов к обзору был взят лист таблицы с генами хромосомы, полученный из feature_table NCBI. Из него средствами Microsoft Excel были отобраны гены, кодирующие белки не короче 100 а.о., и скопированы в два tsv-файла: координаты белок кодирующих генов, координаты генов 16S РНК. С помощью скрипта, предоставленного Артемом Бурлакой, были получены файлы: