BLAST

  1. Поиск гомологов белка по Swiss-Prot
  2. В задании я использовала Коэнзим-А-биосинтезирующий-бифункциональный белок(A0A4Y9F4K1) бактеии Rothia nasimurium. Параметра использованные при запуске BLAST:
    Database – UniProtKB/Swiss-Prot(swissprot)
    Organism – Rothia nasimurium (taxid:85336)
    Algorithm – blastp (protein-protein BLAST)
    Max target sequences – 100
    Expect threshold – 0.05
    Word size – 5
    Max matches in a query range – 0
    Matrix – BLOSUM62
    Gap Costs – Existence: 11 Extension: 1
    Compositional adjustments – Conditional compositional score matrix adjustment Всего получилось 26 результатов(результаты). Для проверки консервативности последовательности этого белка у разных родов бактерий, были выбраны следующие 7:

    Проект Jalview Из 7 белков 3, принадлежащие Staphylococcus epidermidis, Homo sapiens и Malus domestica были удалены так как на достаточно большом участке (200-465) у них были только гэпы. Остальные белки гомологичны, так как на всей длинне имеют несколько больших гомологичных участков(9-59, 80-172, 214-259).

  3. Поиск гомологов зрелого вирусного белка по Swiss-Prot
  4. Для задания был выбран полипротеин POLN_RUBVR
    ID: POLN_RUBVR
    AC: O40955
    OS: Rubella virus
    Белок RNA-directed RNA polymerase p90 с координатами 1302-2116
    Белок в fasta Парамаетры при запуске BLAST оставила без изменений. Было полученно 12 результатов(результаты). Для множественного выравнивания использовались следующие 7:

    Проект Jalview Из 7 белков один, принадлежащий Potato mop-top virus Sw был удален, так как почти не имел гомологичных участков. У остальных 6 по всей длинне можно наблюдать гомологичные участки (1-101, 115-191, 224-250, 266-279, 288-302, 307-331, 376-416, 430-481, 469-476, 483-490, 504-594, 646-836, 849-1014)

  5. Исследование зависимости E-value от объёма банка
  6. Был проведен поиск гомологов с помощью BLAST, с заданым параметром Organism (Viruses), число результатов увеличилось до 18(результаты). Значение E-value у Potato mop-top virus Sw изменилось с 0.007 на 3e-04. Значение E-value определяется формулой: E-value = Kmn·e-λS, где n — размер базы данных. Получаем, что доля вирусных белков в Swiss-Prot примерно равна 4,3%.