- Поиск гомологов белка по Swiss-Prot
В задании я использовала Коэнзим-А-биосинтезирующий-бифункциональный белок(A0A4Y9F4K1) бактеии Rothia nasimurium. Параметра использованные при запуске BLAST:
Database – UniProtKB/Swiss-Prot(swissprot)
Organism – Rothia nasimurium (taxid:85336)
Algorithm – blastp (protein-protein BLAST)
Max target sequences – 100
Expect threshold – 0.05
Word size – 5
Max matches in a query range – 0
Matrix – BLOSUM62
Gap Costs – Existence: 11 Extension: 1
Compositional adjustments – Conditional compositional score matrix adjustment
Всего получилось 26 результатов(результаты). Для проверки консервативности последовательности этого белка у разных родов бактерий, были выбраны следующие 7:
- Aliivibrio fischeri ES114
- Vibrio vulnificus CMCP6
- Escherichia coli CFT073
- Borreliella burgdorferi B31
- Malus domestica
- Homo sapiens
- Staphylococcus epidermidis
Проект Jalview
Из 7 белков 3, принадлежащие Staphylococcus epidermidis, Homo sapiens и Malus domestica были удалены так как на достаточно большом участке (200-465) у них были только гэпы. Остальные белки гомологичны, так как на всей длинне имеют несколько больших гомологичных участков(9-59, 80-172, 214-259).
- Поиск гомологов зрелого вирусного белка по Swiss-Prot
Для задания был выбран полипротеин POLN_RUBVR
ID: POLN_RUBVR
AC: O40955
OS: Rubella virus
Белок RNA-directed RNA polymerase p90 с координатами 1302-2116
Белок в fasta
Парамаетры при запуске BLAST оставила без изменений. Было полученно 12 результатов(результаты). Для множественного выравнивания использовались следующие 7:
- Rubella virus vaccine strain RA27/3
- Rubella virus strain TO-336
- Rubella virus strain Cendehill
- Rubella virus strain Therien
- Rubella virus strain BRDII
- Beet necrotic yellow vein virus S
- Potato mop-top virus Sw
Проект Jalview
Из 7 белков один, принадлежащий Potato mop-top virus Sw был удален, так как почти не имел гомологичных участков. У остальных 6 по всей длинне можно наблюдать гомологичные участки (1-101, 115-191, 224-250, 266-279, 288-302, 307-331, 376-416, 430-481, 469-476, 483-490, 504-594, 646-836, 849-1014)
- Исследование зависимости E-value от объёма банка
Был проведен поиск гомологов с помощью BLAST, с заданым параметром Organism (Viruses), число результатов увеличилось до 18(результаты).
Значение E-value у Potato mop-top virus Sw изменилось с 0.007 на 3e-04. Значение E-value определяется формулой: E-value = Kmn·e-λS, где n — размер базы данных.
Получаем, что доля вирусных белков в Swiss-Prot примерно равна 4,3%.