Программы пакета BLAST для работы с нуклеотидными последовательностями

        1.Поиск гомологов белка AHPF_ecoli в геноме бактерии Pasteurella multocida *  
        
Число находок с Е-value<0,001 2 (section 60, section 130)
Характеристика лучшей находки:  
   E-value находки 7e-37
Название геномной последовательности AE006093 Pasteurella multocida subsp. multocida str. Pm70 section 60 of 204 of the complete genome
Координаты выравнивания(-ий) в найденной последовательности нуклеотидам с 1027 по 89 данной нуклеотидной последовательности сопоставлены аминокислотные остатки белка с 207 по 515
2.Лучшая находка соответствует фрагменту последовательности с кодом доступа AE004439 (релиз 28 августа 2009) в банке EMBL с координатами 660008-660946 комплементарной цепи. Соответствующий CDS имеет координаты 659993-660946 и кодирует белок с ID Q9CN66 в базе UniProt. Этот белок участвует в окислительно-восстановительных процессах клетки,связывает ФАД и с высокой вероятностью действительно является гомологом алкилгидропероксидредуктазы E.coli. 3.При поиске гомологов кодирующей AHPF_Ecoli последовательности программой BLASTN было сделано 6 выравниваний с минимальным E-value, равным 0.18 и максимальной длиной 17 нуклеотидов. * ни одно выравнивание не соответствовало одному из результатов предыдущего поиска. Делаем вывод, что BLASTN находит только идентичные или очень близкие последовательности. В данном случае результаты выравнивания считать достоверными не стоит. 4.При помощи команды getorf пакета EMBOSS (командная строка getorf d89965.entret -table 11 -minsize 30 -find 1 ) нашли 13 открытых рамок в нуклеотидной последовательности с ID D89965. * Из них №5 соответствует обозначенной в записи CDS и №13 - последовательности из записи SwissProt. 5.Используя скрипт, получили таблицу, в которой названиям тРНК E.coli сопоставлено количество выравниваний BLASTN для каждой. (скрипт для получения числа результатов с ограничением по E-value <0.001) Также в таблицу внесены результаты работы программы MEGABLAST. Командная строка следующая: megablast -d ec -m 8 -i <входной файл> -o <выходной файл> Чтобы провести выравнивание с помощью разрывной MEGABLAST потребовались следующие значения параметров: -W 11 -t 16 N 1 6.Заметно, что MEGABLAST более "строга" в отношении длины, процента совпадений и E-value выравниваний, чем программы blastall. Например, ей не было рассмотрено замеченное blastall сходство между нуклеотидными последовательностями с координатами 1-48 и 7716-7763 из записи serW в файле с тРНК E.coli и участком AE006134 генома P.multocida соответственно в силу его маленьких размеров, относительно высокого E-value и процента совпадений менее 94 (выравнивания MEGABLAST с таким же и более низким процентом совпадений имели E-value не выше e-20). В данном случае, учитывая небольшую длину всей последовательности serW, такое выравнивание скорее всего имеет биологическое значение. Из этого Можем сделать вывод, что MEGABLAST мало подходит для поисков гомологов среди таких коротких последовательностей.


К перечню исследовательских работ
На главную