Программы пакета BLAST

1 задание

Для выполнения первого задания я выбрал программу TBLASTN
ссылка на выходной файл
Поиск гомологов белка PDUO_BACSU в геноме L.monocytogenes
Число находок с E-value < 0,001 2
E-value лучшей находки 2e-50
Название последовательности с лучшей находкой ZP_00232664Названия в выходном файле не было, в SwissProt этого белка нет, так что я искал в nr, и это его ACESSION в GeneBank
Координаты лучшей находки (от-до) 72272-72829
Доля последовательности белка PDUO_BACSU, вошедшая в выравнивание с лучшей находкой 188/193

2 задание

a
Запись в БД EMBL, заданная моей последовательностью состоит в классе STD и разделе PRO, ID записи - AB000829.1, это ген α-амилазы бактерии Streptococcus equinus(на EBI я ждал результата минут 10, в то время как на NCBI результат был получен секунд за 5)
б
Координаты записи: 1435-1555, последовательность соответствует направлению записи
в
последовательность входит в кодирующую часть, координаты которой - 595..2823, направленре прямое. Вот, что написано об этом участке в описании:
product="alpha-amylase precursor"
protein_id="BAA24177.1"

3 задание

нуклеотидная последовательность моего белка
Поиск гомологов последовательности гена yvqK, кодирующего белок PDUO_BACSU, в геноме L.monocytogenes
результат программы BLASTN с e-value=1
e-value лучшей находки - 0.003, координаты в геноме бактерии - 30556..30583
Всего обнаружены два гомологичных участка, с e-value = 0.03, и 0.4, что значительно хуже, чем у белковых гомологов, (их тоже 2, но e-value различается на несколько десятков порядков) кроме того, кообдинаты гена лучшего белка вообще не попали в возможные гомологи, и белковые гомологи имеют длину примерно равную длине моего белка (совпадение 189 из 193), в то время как нуклеотидные гомологичные участки имеют длину всего 26bp и 19bp