pano

Поиск гомологов с помощью BLAST.

При запуске BLAST были использованы следующие параметры:

Database: UniProtKB/Swiss-Prot (swissprot)

Algorithm: blastp (protein-protein BLAST)

Max target sequences: 100

Expect treshold: 0,05

Wordsize: 6

Matrix: BLOSUM62

Gap Costs: Existence: 11 Extension: 1

Compositional adjustments: Conditional compositional score matrix

По ссылке можно скачать файл с текстовой выдачей ответа на запрос.

Скачать выравнивание можно по ссылке. Сложно сказать являются ли белки гомологами друг друга, так как есть несколько консервативных участков, а также много инделей. Стоит отметить более высокую парную схожесть H1AE13.1 [Aspergillus fumigatus] и I1BTD7.1 [Rhizopus delemar] ; Q6L6S1.1 [Hydra vulgaris] и Q9GV16.1 [Cyanea nozakii]. Она определяется близким таксономическим положением.

Попротеин вируса.

Я выбрала полипротеин Beet mosaic virus (BtMV) с АС: Q6XW15 и ID: POLG_BTMV.

Для его поиска использовался запрос: name:polyprotein mosaic virus AND reviewed:yes

Далее я выбрала белок капсида (Capsid protein) этого вируса с координатами 2810-3085.

По ссылке можно скачать последовательность этого белка.

Множественное выравнивание первых 6 белков из выдачи BLAST доступно по ссылке. Последовательности почти полностью совпали, так что они гомологи. Это неудивительно, всё это белки довольно простого капсида мозаичных вирусов.

Исследование зависимости E-value от объёма банка.

При укзании таксона Viruses количество находок не изменилось (всё те же 49 последовательностей). Это связано с тем, что белки капсида характерны только для вирусов.

Для геномного полипротеина с кодом доступа P20235.1 значение E-value поменялось с 3е-123 на 1е-124, а вес выравнивания и длина последовательности не изменились. Тогда вирусные белки составляют 1/30 от всех белков в swissprot, то есть 3,33%.