Практикум 6

Задание 2. PWM.

В данном задании нужно было построить позиционную весовую матрицу. Данные брались из статьи Grzegorski et al., PLoS ONE 9(9): e108475, 2014. (из рисунка 1) с допущением, что числа в ячейке матрицы соответствуют числу букв. Для выполнения этого задания я выбрал человека Homo Sapiens. Результаты в таблице

Задание 3. sgmRNA

В данном задании было нужно найти сигналы TRS-L и TRS-B (или только последовательность CS) в лидерной последовательности одного из коронавирусов.
Я выбрал коронавирус Scotophilus bat coronavirus 512 ; NC_009657
Геном данного короновируса содержит 6 белков (полипротеин и 5 поздних белков). Из генома данного короновируса при помощи seqret были вырезаны upstream последовательности ( файл) В качестве upstream была выбрана последовательсть от начала до старта трансляции полипротеина, и последовательности от -100 до -1 позиции от старта трансляции поздних белков.
Далее я использовал сервис MEME для поиска мотивов. Были использованы параметры: Select the site distribution = 0 или 1, Select the number of motifs =3, Can motif sites be on both strands = нет, What should be used as the background model? = 0-order, How many sites must each motif have? Min=2, max = 99999. Первый из найденных мотивов имеет неплохое e-value = 5.2e-003 Он был найден во всех upstream последовательностях (на рисунке изображен красным) Можно предположить, что CS является последовательность TTCAAC, она встречается в 5 из 6 последовательностях, а в 6 отличается всего на 1 нуклеотид.
Выдача MEME: в формате html, в формате txt