Задание к лекции 5
Составил ААл.
Пожалуйста, присылайте ответы мне на адрес aba@belozersky.msu.ru
1. Предскажите гены в последовательности генома Mycoplasma mycoides (штамм subsp. mycoides SC str. PG1). Сравните с тем, как определены гены в геноме, лежащем в базе данных Genome
У Mycoplasma mycoides одна кольцевая хромосома. Последовательность ДНК лежит здесь. Её надо сохранить: кнопка Send, выбрать File, Complete record, FASTA (это формат) и нажать Generate File
Для предсказания генов используйте сервис GeneMarkS. Загрузите файл в окошко (upload file или положите все содержимое файла, включая первую строчку, в окошко). Выберите Prokaryotic, LST - результат в виде таблицы, genetic code 4, так как генетический код микоплазм отличается от стандартного для бактерий, имеющего номер 11. Start
- Сохраните таблицу с предсказаниями (link, gms.out)
Геном с аннотациями генов лежит здесь. Гены белков содержат поле CDS - CoDing Sequence. Для удобства сравнения я свел все данные о генах белков в таблицу Excel
- Минимальный ответ:
- сравните число предсказанных генов белков и число генов белков "в ответе" (в банке Genome)
- опишите пять отличий предсказания от ответа
- Максимальный ответ:
- приведите полную статистику ошибок предсказания (число правильных предсказаний, число ошибок по типам - ошибка в координате старт кодона; стоп кодона; ген предсказан, а в ответе его нет; ген есть, но не предсказан, ...)
Для сравнения удобно использовать Excel (или Open Office)