Занятие 5. Предсказание генов в участке генома бактерии. Вариант #1
Поиск велся по нуклеотидным поседовательностям программой БЛАСТИКС. Выбор обусловлен тем, что
изначально предложена нуклеотидная последовательность. ТБЛАСТИКС применяется для других целей,
работает долго (как было написано в подсказках к заданию. Я пробовал провести поиск ТБЛАСТИКСом, но ничего вразумительного не получил — выравнивались маленькие фрагменты). БЛАСТИКС как раз и используется для поиска кодирующих участков в нуклеотидовых последовательностях.
Найдено три последовательности с E-value < 0.001 и с процентом идентичнотси > 60%. Оставшиеся я посчитал не гомологичными — лучшая из оставшихся находок имеет процент идентичности 37%, участки выравнивания короткие. Судя по описаниям (в точности Nitrite reductase large subunit (EC 1.6.6.-), Flavorubredoxin reductase, DNA helicase) это белки выстречающиеся в большинстве организмов, выполняют консервативные функции и, поэтому имеют некоторые консервативные участки, которые и нашла программа БЛАСТИКС. 3'------------------------------------------------[<=Q8ZQ01 , 2561-4000]-------5' 2# Сравнение
Записи всех генов в банках ЮниПрот и ЕМБЛ совпадают. Стоит заметить что в ЕМБЛ было найдено две записи полных геномов AE008752 и AE008753. Последний более длинный (Salmonella typhimurium LT2, section 57 of 220 of the complete genome, в то время как у
AE008752 -- section 56 of 220). В результате белок Q8ZQ01 был найден только в нем. Использовались: seqret, formatdb, blastall (blastx), more, needle (стандартные параметры). |