1. Поиск гомологов белка в Swiss-Prot

В практикуме 7 мной был выбран белок Hypoxanthine phosphoribosyltransferase (AC:C7MC15) из Brachybacterium faecium (strain ATCC 43885 / DSM 4810 / JCM 11609 / LMG 19847 / NBRC 14762 / NCIMB 9860 / 6-10). Последовательность была скачена из Swiss-Prot в формате .fasta и загружена на BLAST. Для поиска гомологов были заданы следующие параметры:

Такие параметры, как Filters and Masking, не выбирались. По результатам поиска нашлось 50 гомологов, из которых были выбраны следующие 7:

Далее было создано множественное выравнивание последовательности своего белка и отобранных находок в Jalview, на основании котрого можно сделать вывод, что белки гомологичны, так как наблюдается большое количество консервативных участков (211-219, 301-307, 444-456, 472-682). Можно отметить, что большинство участков находятся конце, почти все индели располагаются в начале и середине.

2. Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина, в Swiss-Prot

Для выполнения данного задания я выбрала следующий полипротеин:

В качестве зрелого белка я выбрала Envelopment polyprotein c координатами 18-1140. С помощью команды seqret 'sw:gp_nyv[18:1140]' gp_nyv.fasta я вырезала последовательность зрелого белка в отдельный файл в fasta-формате. Для поиска гомологов были заданы те же самые значения параметров в BLAST, что и в первом задании. В результате было найдено 22 результата.

Было проведено множественное выравнивание в Jalview, по результатам котрого можно сделать вывод, что данные последовательности не гомологичны, так как присутсвует много инделей и многие из них довольно протяженной длины: 14-88, 105-125, 177-184, 249-259, 405-418, 733-759, 772-784, 791-827, 837-902, 916-933, 963-998, 1038-1065, 1110-1118, 1248-1257, 1275-1283, 1305-1316, 1477-1484, 1541-1551, 1571-1579.

3. Исследование зависимости E-value от объёма банка

Был проведен аналогичный поиск, но помимо предыдущих параметров BLAST был применен фильтр по организмам (Organism: Viruses (taxid:10239)). Число находок не изменилось, находится всё так же 22 результата. При использовании фильтра по организмам у 4 из 22 находок поменялось значение E-value, например, у P41264.1 с 5е-153 до 2е-154. Таким образом, доля вирусных белков в Swiss-Prot составляет ~4%.