Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2019

Практикум 6

Мини КР.

Выполняется в начале занятия.

1. Создание позиционной весовой матрицы (PWM) для последовательностей Козак одного из организмов

Выполняется в конце занятия; можно закончить дома в день занятия.

Крайний срок сообщения о выполнении - суббота 20 марта до 15:00. При записи в очередь - выбрать пункт 6.1.

'''Данные''' из статьи Grzegorski et al., PLoS ONE 9(9): e108475, 2014, рис.1. Считать, что число в ячейке матрицы равно числу соответствующих букв в колонке (хотя в статье это проценты).

Выбор варианта: произвольный из семи, кроме тех, которые у соседей (по парте, компьютеру, общежитию и мобильнику)

Нужна ссылка на файл с результатом: величины псевдоотсчётов и матрица PWM для участка от -3 до 4 (7 позиций в выравнивании) и промежуточными вычислениями (текст программы или формулы в Excel).

При зачёте задания засчитывается соответствующая тема коллоквиума.

2. Найти мотив указанного сигнала с помощью сервиса MEME

При записи в очередь - выбрать пункт 6.2.

Для зачёта 2 достаточно выполнить ОДНО из заданий 2a, 2b. Выбираете самостоятельно.

Результат должен быть представлен на сайте. Должен включать:

Просто ссылка на файл с выдачей программы MEME (дескать, разбирайтесь сами) не принимаются!

Будьте добры, разберитесь с выдачей; выберите то, что нужно, и представьте в отчете на своем сайте.

2a. В геноме одного из коронавирусов (Coronaviridae) найдите мотив сайта разрывной транскрипции sgRNA

Пояснение. sgmRNA - субгеномная матричная РНК коронавирусов (Coronaviridae) и других (но не всех) нидовирусов (Nidovirales). Она образуется путем объединения участка с геном позднего белка с лидерной последовательностью при образовании -РНК (т.е. РНК, комплементарной к РНК вируса, являющейся +РНК) с последующей репликацией полученной (-sgRNA)в +sgRNA.

Читайте презентацию и статью, указанную в ней.

В идеале должен найтись сигнал в лидерной последовательности, называемый TRS-L (TRS от Transcription-Regulating Sequence) и сигналы TRS-B перед кодирующей последовательностью каждого позднего гена. Координаты всех поздних генов найдете в соответствующей записи с геномом в формате Genbank. Все сигналы TRS-B и TRS-L включают одинаковую последовательностью из шести нуклеотидов. Последовательность называется CS (от Core Sequence). В статье она приведена для того коронавируса, который изучали авторы. Сигналы TRS шире CS на несколько (неизвестно сколько) нуклеотидов с 5' и 3' стороны. Если найдете только сигналы CS, этого будет достаточно.

Выбор коронавируса На странице Genome NCBI (https://www.ncbi.nlm.nih.gov/genome/browse#!/overview/) в окошке напишите Coronaviridae. В списке Из списка выбирайте любой, проверив что геном полный: в какой-то колонке должен быть полностью черный кружок.

2b. В геноме одной бактерии или археи найдите мотив сайта посадки рибосомы - последовательности Shine-Dalgarno

Можно выбрать любой геном, например, "свой" геном из первого семестра.


'''подсказки'''


Дополнительные задания

3. Кратко опишите один интересный молекулярно-биологический сигнал

Интересный в том смысле, что не общеизвестный, его не проходят в школе и на первом курсе, отсутствует в лекции-1 по сигналам (19 марта).

В описании укажите:

Источники:

Описание приведите на своём сайте. Лаконичность приветствуется. Если использовали источники - ссылки обязательны.

Если студенты предложат несколько интересных примеров, сделаю каталог со ссылками на ваши сайты.