Учебная страница курса биоинформатики,
год поступления 2016
- Результаты обязательных заданий 1-4 вносятся в
- Результаты каждого задания сохраняются
- Задание 3 следует выполнить три раза - для трех белков
- Требование: все ссылки должны быть на файлы в своей директории public_html
- Датой выполнения задания считается дата выполнения задания 5. На веб-страницы обязателен список выполненных заданий; больше может не быть ничего
Результаты выполнения дополнительного задания помещается на сайт, стр. практикума 8. Техническая часть - "blast всех против всех" - оценивается из 1 балла. В содержательной части надо что-то нетривиальное придумать (из 5 баллов). Так что советую за него не браться
Нуклеотидный blast
1. Определите таксономию и функцию прочтенной вами нуклеотидной последовательности (из практ. 6)
В отчете укажите (i) предполагаемую функцию или аннотацию последовательности - если она не кодирует ген белка; (ii) предполагаемую таксономию; (iii) обоснования своих решений
Подумайте или посмотрите в презентации (i) какой вариант алгоритма BLAST использовать и в какой базе данных искать; (ii) какие находки и сколько достаточно для аннотации; (iii) как решить к какому уровню таксономии - виду, роду, семейству,... - возможно отнесение находки (см. подсказки); (iv) какие данные стоит привести в отчете (см. подсказки)
2. Сравните списки находок нуклеотидной последовательности 3-я разными алгоритмами blast
- В отчете напишите, что демонстрирует сравнение трех алгоритмов. Возьмите ту же последовательность, что в задании 1 (можно взять и любую другую). Ограничьте область поиска так, чтобы результат сравнения был показателен (см. подсказки). Подробнее об оформлении отчета см. в подсказках
3. Проверьте наличие гомологов трех белков в геноме одного организмов
Организм X5 (Amoeboaphelidium protococcarum), сборка генома X5 лежит на диске P: в директории y15/term3/block2/pr8
Белки можно (но не обязательно) взять из списка:
- HSP71_YEAST - шаперон HSP70, белок теплового шока;
- TERT_SCHPO - теломераза,восстанавливающая длину хромосомы при репликации; имеется у большинства (но не всех) эукариот
- PRPC_EMENI - митохондриальная цитратсинтаза
- EIF3G_SCHPO - фактор инициации трансляции eIF3g, содержит также РНК связывающий домен
- HIS31_HUMAN - гистон H3, белок, участвующий в образовании нуклеосомы
- TBB_NEUCR - тубулин, белок, участвующий в образовании микротрубочек
Можно выбрать на свое усмотрение из тех, которые, по вашему мнению, должны быть почти у всех эукариот.
4. Найдите один ген белка, закодированный в одном скэффолде ''Amoeboaphelidium protococcarum''
Для поиска выберите один контиг длины порядка десятков тысяч пар нуклеотидов. Интроны у амебоафилидум короткие, так что ген может поместиться в одном таком контиге.
Описать в отчете нужно ОДИН наиболее правдоподобный ген, найденный с помощью BLAST. BLAST Едва ли позволит найти точные границы гена, это и не требуется.
5.Создайте страницу практикума 8 со списком выполненных заданий
6.(*ДОПОЛНИТЕЛЬНОЕ) Классифицируйте геномы родственных вирусов по сходству последовательностей ГЕНОМОВ
Аннотации белков не используйте!
- Выберите вирус (например, тот, который был у вас в первом семестре). Техническое ограничение - геном не фрагментирован, т.е. представлен одной последовательностью.
- Выберите подходящий вариант blast.
- Сохраните пять полных геномов того же вида и/или рода вирусов
Выполните поиск все - против всех
Придумайте способ как оценить сходство между вирусами.
- См. подсказки
- В отчет включите
- ссылку на файл Excel с результатами blast (после "прочистки" скриптом, см. подсказки)
- Придуманную вами меру сходства (или расстояния) между геномами
- выводы по результатам сравнения геномов; можно - но не обязательно - в виде филогенетического дерева
Under construction