Online-BLAST

По данной мне последовательности я нашёл, что она является фрагментом генома археи Methanothermobacter thermautotrophicus, её идентификатор в базе данных RefSeq - NC_000916.1. В геноме этой археи этот участок располагается с 1145 по 1444 нуклеотиды и кодирует белок 50s субъединицы рибосомы L3P.

Для дальнейшей работы был выбран белок из генома человека с идентификатором в базе данных Uniprot - DEF1_HUMAN. fasta - последовательность этого белка можно посмотреть в этом файле. С помощью сревиса ENA были найдены гомологи этого белка в геноме африканского слона. Все найденные записи представлены в таблице 1.

Таблица 1. Список найденных в ENA гомологов человеческого белка DEF1_HUMAN в геноме loxodonta_africana/
Species Description Alignment Length Target Length Identity(%) E-Value
loxodonta_africana supercontig:loxAfr3:scaffold_20:1:46401353:1 REF 59 174 52 2E-6
loxodonta_africana supercontig:loxAfr3:scaffold_20:1:46401353:1 REF 59 174 50 4E-6
loxodonta_africana supercontig:loxAfr3:scaffold_19:1:48870786:1 REF 51 150 57 6E-6
loxodonta_africana supercontig:loxAfr3:scaffold_2:1:107953029:1 REF 37 111 55 6E-5

Луший E-value - это 2E-6, длина этого выравнивания 174, а Identity - 52. Координаты гена, кодирующего этот белок в гшеноме слона : 17473-17646, в этом гене нет интронов. Полученное выравнивание человеческого белка и белка африканского слона можно увидеть тут.

В геноме бактерии Oceanobacillus iheyensis штамм HTE831, была выбрана последовательность тРНК. С помощью торёх разичных алгоритмов был прорведён BLAST этой последовательности, результаты можно увидеть в таблице 2.

Таблица 2. Результаты работы различных алгоритмов BLAST
Алгоритм Число находок (E-value < 0.001) Минимальный E-value Максимаьный E-value
megablast 88 2e-32 4e-14
blastn, стандартные параметры 100 2e-31 2e-23
blastn, word size = 7, match/mismatch = 1/-1 100 9e-27 5e-21

Алгоритм megablast выдаёт меньше находок и минимальное значение e-Value меньше, чем при других алгоритмах, но при этом максимальное значение также возросло. Но на деле нашлось всего 3 записи с e-Value большим, чем при blastn, то есть в целом megablast имеет более точный и "строгий" алгоритм. Возможно эта точность даже может мешать нахождению гомологов, потому что в blastn (при использовании и стандартного алгоритма, и алгоритма с дополнительными параметрами), например, была найдена запись Bacillus atrophaeus subsp. globigii strain BSS genome, которой не было при megablast, не было найдено вообще ни одной записи об организме Bacillus atrophaeus, хотя e-value этой находки 5e-21, а Identity - 92%. При этом бактеория Bacillus atrophaeus принадлежит к тому же семейству, что и Oceanobacillus iheyensis, то есть megablast подходит для поиска гомологов среди очень близких филогенетически организмов, а blastn - для более широкого поиска.

© Демкив Андрей 2013 Дата последнего изменения: 29.05.2015