Учебная страница курса биоинформатики,
год поступления 2015
Исправил ошибку в написании ''Amoeboaphelidium protococcarum''. Спасибо Анне Ершовой, указавшей на нее :) ААл
Нуклеотидный blast
1. Определите таксономию и функцию прочтенной вами нуклеотидной последовательности (из практ. 6)
В отчете укажите (i) предполагаемую функцию или аннотацию последовательности - если она не кодирует ген белка; (ii) предполагаемую таксономию; (iii) обоснования своих решений
Подумайте или посмотрите в презентации (i) какой вариант алгоритма BLAST использовать и в какой базе данных искать; (ii) какие находки и сколько достаточно для аннотации; (iii) как решить к какому уровню таксономии - виду, роду, семейству,... - возможно отнесение находки (см. подсказки); (iv) какие данные стоит привести в отчете (см. подсказки)
2. Сравните списки находок нуклеотидной последовательности 3-я разными алгоритмами blast
- В отчете напишите, что демонстрирует сравнение трех алгоритмов. Возьмите ту же последовательность, что в задании 1 (можно взять и любую другую). Ограничьте область поиска так, чтобы результат сравнения был показателен (см. подсказки). Подробнее об оформлении отчета см. в подсказках
3. Проверьте наличие гомологов трех белков в геноме одного организмов
Организм X5 (Amoeboaphelidium protococcarum), сборка генома X5 лежит на диске P: в директории y15/term3/block2/pr8
Белки можно (но не обязательно) взять из списка:
- HSP7C_HUMAN - консервативный шаперон HSP70, белок теплового шока; имеется у большинства организмов из всех царств
- TERT_HUMAN - теломераза,восстанавливающая длину хромосомы при репликации; имеется у большинства (но не всех) эукариот
- CISY_HUMAN - митохондриальная цитратсинтаза
- RPB1_HUMAN - субъединица ДНК-зависимой РНК-полимеразы II
- PABP2_HUMAN - белок, чвязывающий поли(А) хвост матричной РНК
Можно выбрать на свое усмотрение из тех, которые, по вашему мнению, должны быть почти у всех эукариот.
4. Найдите один ген белка, закодированный в одном скэффолде ''Amoeboaphelidium protococcarum''
Спасибо Сефербековой за замеченную неточность в формулировке задания! ААл
Для поиска выберите один контиг длины порядка десятков тысяч пар нуклеотидов. Интроны у амебоафилидум короткие, так что ген может поместиться в одном таком контиге.
Описать в отчете нужно ОДИН наиболее правдоподобный ген, найденный с помощью BLAST. BLAST Едва ли позволит найти точные границы гена, это и не требуется.
Методы и отчет - на ваше усмотрение.
5.(*ДОПОЛНИТЕЛЬНОЕ) Классифицируйте геномы родственных вирусов по сходству последовательностей
- Выберите вирус (например, тот, который был у вас в первом семестре)
- Сохраните пять полных геномов того же вида и/или рода вирусов
- См. подсказки
Сравните геномы с помощью tblastX: на вход - все последовательности, поиск в blast БД тех же последовательностей, формат - табличный (-outfmt 7 - с заголовками; -outfmt 8 - без заголовков; удобнее 8, а потом вставить заголовки из запуска 7 для одной посл-ти)
- В отчет включите
- ссылку на файл Excel с результатами blast (после "прочистки" скриптом, см. подсказки
- выводы по результатам сравнения геномов
Поскольку я не знаю как оценивать сходство двух геномов вирусов, то принимается любой способ. Например,
- по максимальному проценту сходства двух трансляций (не очень хороший способ)
- по среднему проценту сходства всех трансляций (не очень хороший способ)
- по суммарной длине сходных пбелковых последовательностей (не очень хороший способ)
- ну, изобретите еще что-нибудь, пожалуйста!
Открою секрет: нет единого мнения о том, как описывать филогению вирусов по последовательностям геномов из-за их быстрой эволюции и частых потерь и приобретений новых генов
* Аннотация фрагмента ДНК, наличие гомолога в БД ожидается.