Учебная страница курса биоинформатики,
год поступления 2019
Практикум 6
Мини КР.
Выполняется в начале занятия.
1. Создание позиционной весовой матрицы (PWM) для последовательностей Козак одного из организмов
Выполняется в конце занятия; можно закончить дома в день занятия.
Крайний срок сообщения о выполнении - суббота 20 марта до 15:00. При записи в очередь - выбрать пункт 6.1.
'''Данные''' из статьи Grzegorski et al., PLoS ONE 9(9): e108475, 2014, рис.1. Считать, что число в ячейке матрицы равно числу соответствующих букв в колонке (хотя в статье это проценты).
Выбор варианта: произвольный из семи, кроме тех, которые у соседей (по парте, компьютеру, общежитию и мобильнику)
Нужна ссылка на файл с результатом: величины псевдоотсчётов и матрица PWM для участка от -3 до 4 (7 позиций в выравнивании) и промежуточными вычислениями (текст программы или формулы в Excel).
При зачёте задания засчитывается соответствующая тема коллоквиума.
2. Найти мотив указанного сигнала с помощью сервиса MEME
При записи в очередь - выбрать пункт 6.2.
Для зачёта 2 достаточно выполнить ОДНО из заданий 2a, 2b. Выбираете самостоятельно.
Результат должен быть представлен на сайте. Должен включать:
- Описание выбора входных последовательностей для MEME и ссылку на файл с ними.
- Ссылку на позиционную весовую матрицу (PWM)
- Описание найденных мотивов из выдачи MEME
- Число и процент генов белков, перед которыми найден сигнал
- Данные из литературы, если нашли.
- Короткое обсуждение результата
Просто ссылка на файл с выдачей программы MEME (дескать, разбирайтесь сами) не принимаются!
Будьте добры, разберитесь с выдачей; выберите то, что нужно, и представьте в отчете на своем сайте.
2a. В геноме одного из коронавирусов (Coronaviridae) найдите мотив сайта разрывной транскрипции sgRNA
Пояснение. sgmRNA - субгеномная матричная РНК коронавирусов (Coronaviridae) и других (но не всех) нидовирусов (Nidovirales). Она образуется путем объединения участка с геном позднего белка с лидерной последовательностью при образовании -РНК (т.е. РНК, комплементарной к РНК вируса, являющейся +РНК) с последующей репликацией полученной (-sgRNA)в +sgRNA.
Читайте презентацию и статью, указанную в ней.
В идеале должен найтись сигнал в лидерной последовательности, называемый TRS-L (TRS от Transcription-Regulating Sequence) и сигналы TRS-B перед кодирующей последовательностью каждого позднего гена. Координаты всех поздних генов найдете в соответствующей записи с геномом в формате Genbank. Все сигналы TRS-B и TRS-L включают одинаковую последовательностью из шести нуклеотидов. Последовательность называется CS (от Core Sequence). В статье она приведена для того коронавируса, который изучали авторы. Сигналы TRS шире CS на несколько (неизвестно сколько) нуклеотидов с 5' и 3' стороны. Если найдете только сигналы CS, этого будет достаточно.
Выбор коронавируса На странице Genome NCBI (https://www.ncbi.nlm.nih.gov/genome/browse#!/overview/) в окошке напишите Coronaviridae. В списке Из списка выбирайте любой, проверив что геном полный: в какой-то колонке должен быть полностью черный кружок.
2b. В геноме одной бактерии или археи найдите мотив сайта посадки рибосомы - последовательности Shine-Dalgarno
Можно выбрать любой геном, например, "свой" геном из первого семестра.
Дополнительные задания
3. Кратко опишите один интересный молекулярно-биологический сигнал
Интересный в том смысле, что не общеизвестный, его не проходят в школе и на первом курсе, отсутствует в лекции-1 по сигналам (19 марта).
В описании укажите:
- В чем состоит сигнал
- Кому адресован
- Предназначение - как должен реагировать адресат
- Эффективность сигнала:
- высокоэффективен если (почти) каждый раз адресат реагирует на сигнал
- низко эффективен если чаще адресат не реагирует на сигнал
Источники:
- может сталкивались в курсовой или других мол.-биол. активностях
- литература и интернет
- придумали исходя из того, что какой-то молекулярно-биологический процесс должен регулироваться, значит нужен сигнал; поискали, в литературе не нашли; придумали, что он мог бы быть таким-то.
Описание приведите на своём сайте. Лаконичность приветствуется. Если использовали источники - ссылки обязательны.
Если студенты предложат несколько интересных примеров, сделаю каталог со ссылками на ваши сайты.
Замечание Насколько я могу судить по доступной литературе такая работа еще не была выполнена никем для доступных сегодня геномов коронавирусов, в частности, для нашего любимого SARS-CoV-2. Биология любит неожиданности. Поэтому, ваш отрицательный результат тоже будет зачтен, если будут описаны предпринятые попытки и их результат. Положительные результат тоже будет зачтен :)
В Pubmed поискал статьи об идентификации и механизму синтеза sgmRNA в порядке Нидовирусов (содержит семейство коронавирусов). Нашел две статьи 2017 - 2018 года, в которых идентифицированы sgmRNA методом NGS или рибосомного профайлинга. [1] Di et al., PNAS, 2017 (вирус arterivirus: Simian hemorrhagic fever virus (SHFV)). [2] Stewart et al., Journal of Virology, 2018 (Torovirus (subfamily Torovirinae, family Coronaviridae)
Не без сюрпризов: [1] - множественные TRS-B сигналы, [2] - нашли новые белки U1 и U2 в 5' UTR
Если захотите найти статьи, то поиск в Pubmed: Di[1au] 2017[dp] PNAS[ta] и т.п.
К сожалению, биоинформатические предсказания сигналов TRS-L и TRS-B похоже отсутствуют. Ваши результаты могут оказаться новыми.
Договоритесь как-нибудь кто какой геном берет. И пришлите списочек. SARS-CoV-2 предлагаю разыграть!!! Бета коронавирусы в приоритете, т.к. наш любимый из этой группы. Посмотрел - в списке 52 разных коронавируса, на всех хватит.
Можно, если два человека будут работать с одним и тем же геномом. Результаты можно будет сравнить. Совместная работа не запрещена. Но если работаете совместно - вклад каждого обязан быть написан ПРЯМО.