BLAST

Результаты поиска гипотетических гомологов белка PDAA_BACSU:

  Поиск по Swiss-Prot Поиск по PDB Поиск по "nr"
1. Лучшая находка (с последовательностью исходного белка)
Accession O34928.1 1W17_A YP_006628965.1
E-value 0.0 0.0 0.0
Вес (в битах) 554 bits 554 bits 554 bits
Процент идентичности 100% 100% 100%
2. Число находок с E-value < 10–10 1 3 13
3. "Худшая из удовлетворительных" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний 27 15 100
Accession O13842.1 4HD5_A ZP_17375824.1
E-value 0.004 0.76 5e-92
Вес (в битах) 41.2 bits 31.2 bits 283 bits
% идентичности 19/63(30%) 32/106(30%) 131/252(52%)
% сходства 36/63(57%) 48/106(45%) 180/252(71%)
Длина выравнивания 63 106 252
Координаты выравнивания (от-до, в запросе и в находке) 63-125;66-127 62-156;194-294 2-253;4-255
Число гэпов 1/63(1%) 16/106(15%) 0/252(0%)

Анализирование результатов поиска PDAA_BACSU по разным БД в BLASTP:



Поиск гипотетических гомологов изучаемого белка с фильтром по таксонам. Искать буду в "nr", так как там самый большой выбор результатов.

Хочется найти гомологи как можно более близкие по последовательности, но при этом как можно более удаленные филогенетически. Лучшие находки по таксонам:

Царство Eukaryota

Отдел Actinobacteria

Класс Clostridia

Порядок Lactobacillales

Семейство Listeriaceae

Род Geobacillus

Вид Bacillus anthracis

Мне больше всего нравится результат по поиску в отделе Actinobacteria, так как при такой филогенетической удаленности организмов очень любопытно найти организмы с такими показателями, в частности идентичности последовательности - 39%! Как мы видим далее с порядком Lactobacillales лучший результат и то хуже, хотя группы организмов более поздно разошлись на филогенетическом древе.



BLAST двух последовательностей:

С помощью программы BLAST создается парное выравнивание белка pdaa_bacsu и его гомолога pdab_bacsu. Для охарактеризования выравнивания используются карты локального сходства. Можете посмотреть на них в двух видах: с порогом на E-value, равным 10 (по умолчанию) и с порогом на E-value, равным 0.01.

Рис. 1. Карта локального сходства с порогом E-value равным 10. Рис. 2. Карта локального сходства с порогом E-value равным 0.01.

Графики получились различными для разных значений параметра E-value. Это случилось потому, что для маленького участка сходства (рис. 1) значение E-value больше 0.01, а большой участок совпал на первом и втором рисунке.



Сравнение результатов поиска с различными матрицами BLOSUM

Сравним результаты матрицы BLOSUM62 и BLOSUM45 по лучшему (с моей точки зрения) удаленному филогенетически гомологу, а им являлся результат по запросу таксона: отдел Actinobacteria. Как упоминалось ранее в другой моей работе (предыдущей: "Применение алгоритмов парных выравниваний к белку PDAA_BACSU") число после названия матрицы обозначает порог кластеризации.

Для матрицы BLOSUM62 результаты выше (не вижу смысла их повторять на одной странице несколько раз). А для матрицы BLOSUM45 смотрите ниже:

Отдел Actinobacteria

Следовательно результаты совпали.



Сравнение различных интерфейсов программы BLAST

Программой BLAST можно пользоваться на различных серверах, таких как NCBI (которым пользовалась я для выполнения вышеизложенных иследований), EMBL-EBI и UniProt.

В интерфейсе EMBL-EBI мне не понравилось, что нельзя вводить accession number и gi, а только непосредственно последовательность вручную или с помощью загрузки файла - это не удобно. В UniProt же мне не понравилось, что нужно при прочих равных (количество находок в том и другом случае выставлено 100) ждать относительно долго - ~30сек, а в EMBL-EBI и NCBI около 12. В целом мне больше понравился интерфейс у NCBI, хотя, стоит заметить, что у EMBL-EBI есть значительный плюс, он состоит в том, что когда смотришь результаты, они представлены более компакно и можно по выбору отмечать те, результаты, которые хочется посмотреть с выравниваниями и те что без (с помощью отметки галочкой необходимого и задачи нужного слева) и еще (!) выравнивания можно скачать в fasta формате. Единственное достоинство, которое мне импонировало на данный момент в UniProt BLAST, заключается в том, что есть колонка с "звездочками" в результатах, которая показывает какие последовательности лежат в Swissprot, а какие в TrEMBL (подробнее об разнице между ними вы можете прочитать в моей работе "UNIPROT").

Источники информации


© Tishina Sofia, 2012