Работа с программой BLAST

1. Поиск гомологов белка FtsY в Swiss-Prot

Для выполнения заданий практикума я выбрала белок, рассматриваемый в практикуме 7. Для поиска гомологов данного белка по базе данных NCBI BLAST были выставлены параметры, представленные в таблице 1.
Таблица 1. Параметры поиска гомологов белка FtsY photo
По запросу было выдано 138 находок, из которых я выбрала 6, включая белок бактерии Enterococcus lactis, после чего создала множественное выравнивание рассматриваемого белка и находок. Как видно из проекта с выравниванием, все 6 белков являются гомологичными друг другу. Это видно по многочисленным консервативным участкам. Организмы, белок которых рассматривается в задании:

-Enterococcus lactis

-Myciplasma pneumoniae (strain ATCC 29342)

-Streptococcus mutans serotype c (strain ATCC 700610

-Metamycoplasma hominis (strain ATCC 23114)

-Aquifex aeolicus (strain VF5)

-Escherichia coli (strain K12)

2. Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина

Из базы данных UniProt - Swiss-Prot я выбрала аннотированный вирусный полипротеин Envelopment polyprotein (GP_SFTS) организма Dabie bandavirus, некоторые характеристики которого представлены в таблице 2 ниже:
Таблица 2. Основные характеристики Envelopment polyprotein photo
Выше представлена ссылка на fasta-файл с 1 из белков данного полипротеина, а именно Glycoprotein N c координатами [20-562]. Выставив идентичные заданию 1 параметры в программе BLAST, за исключением filter: low complexity regions и organism (поле осталось незаполненным, так как поиск осуществляется по всем группам организмамов), был выполнен поиск гомологов, результатом которого являются 5 находок:

-SFTS virus HB29

-Heartland virus

-Bhanja virus

-Uukuniemi virus S23

-Severe fever with thrombocytopenia syndrome virus

Результат выравнивания белков этих организмов можно увидеть перейдя по этой ссылке. В этом случае всвязи с большим количеством консервативных участков также можно сделать вывод о гомологичности этих 6 белков.

3. Исследование зависимости Е-value от объема банка

Для исследования данной зависимости был выполнен поиск, идентичный поиску в задании 2, а также подобный ему, но уже с заполнением поля organizm: Viruses (taxid:10239 ). Результатом поиска также являются те же самые 5 находок, однако теперь некоторые из них имеют отличные от первого поиска результат E-value. Для организма Bhanja virus в первом случае показатель E-value составляет 7е-34, а во втором - 3е-35. Для организма Uukuniemi virus S23 этот параметр соответсвтенно равен 2е-15 и 7е-17. Для того, чтобы найти приближенную оценку для доли записей по вирусам в Swiss-Prot, я нашла приближенное значение для каждого организма, поделив второе значение с заданием параметра в поле organism на первое, получив примерный результат 4,3% и 3,5%, и затем, посчитав их среднее арифметическое, получила окончательный результат, равный 3,9%.