Протокол занятия

Поиск в геноме Pasteurella multocida и во всех трех данных геномах участков, кодирующих белки, похожие на заданный

Поиск гомологов TKT1_ECOLI Геном Pasteurella multocida
Число находок с Е-value<0,001 4
Характеристика лучшей находки: Pm70 section 168 of 204 of the complete genome
E-value находки 0.0
AC соответствующей записи EMBL AE006201
Kоординаты выравнивания(-ий) в записи EMBL (1, 2158) - (663,155)
Координаты CDS в записи EMBL complement(152..2158)
AC UniProt в записи EMBL P57958
Число находок с Е-value<0,001 (поиск по трем геномам) 10
E-value лучшей находки 0.0

Для поиска гомолога белка TKT1_ECOLI в нуклеотидных последовательностях данных геномов была использована программа TBLASTN.
Координаты выравнивания в записи EMBL - (Query, Sbjct).
После поиска по трем геномам E-value лучшей находки не изменился, но (появилось два участка гена из генома st - Salmonella typhimurium c более высоким Score) она переместилась на третье место (файл tblastn_result_2.fasta). Значит наиболее вероятный гомолог (даже гомологи) для гена, кодирующего мой белок TKT1_ECOLI, находится все-таки не в геноме Pasteurella multocida, который предлагался для поиска в задании.

Поиск гомологов с помощью программы BLASTN

Лучшая находка - Salmonella typhimurium LT2, section 145 of 220 of the complete genome
E-value - 0.0
AC - AE006468
Здесь можно увидеть соответствующее выравнивание и аннотацию для этой находки.
Если сравнить полученный результат в этом задании с предыдущим, то прежде всего можно заметить разницу в Score и в hit-list, полученных выдач tblastn и blastn. В первом случае наблюдается постепенное падение Score (по крайней мере в первых четырех находках). Во втором случае вес лучшей находки, указанной выше, на порядок отличается от весов других выравниваний. Это можно объяснить тем, что во втором случае увеличивается база поиска, поскольку длина последовательности аминокислот меньше нуклеотидной. А также в следствие разного количества вариантов аминокислот и азотистых оснований (для аминокислотной последовательности-20, для нуклеотидной-4) возрастает вероятность случайных совпадений для нуклеотидной последовательности. Я думаю, это две основные причины, лежащие в основе наблюдаемых различий.

Вернуться на главную страничку

© Головкина Мария Сергеевна