Практикум 10

Для поиска гомологов фермента глицеральдегид-3-фосфат дегидрогеназы(Q5DQD5_9VIBR) полученного из Vibrio neonatus был запущен BLAST со следующими параметрами:


Database: UniProtKB/Swiss-Prot
Algorithm: blastp (protein-protein BLAST)
Expect threshold: 0.05
Word size: 5
Matrix: BLOSUM62
Max target sequences: 100


Файл с текстовой выдачей можно скачать по ссылке

Для множественного выравнивания помимо исходного белка были выбраны следующие гомологи:

Citrobacter freundii(P24748)
Pseudescherichia vulneris(P24751)
Klebsiella aerogenes(P24163)
Escherichia fergusonii(P0C8Z1)
Escherichia coli K-12(P0A9B2)


Результаты выравнивания находятся по ссылкам (выравнивал с помощью ClustalW):
  • Файл Fasta
  • Jalview

  • Результаты выравнивания показали, что последовательности белков достаточно консервативны (логично).

    Гомологи вирусного белка

    В качестве вирусного полипротеина я выбрал New York virus (NYV), его ID - GP_NYV, AC - Q83887.
    В этом полипротеине я выбрал зрелый белок Glycoprotein N (18..652) и вырезал его с помощью команды seqret. Дальше я отправил этот белок в Blast и получил список гомологов, из которого выбрал 4 белка, не считая исходного:

    Orthohantavirus sinnombreense(Q89905)
    Orthohantavirus nigrorivense(P0DTJ0)
    Orthohantavirus andesense(Q9E006)
    Puumala virus p360(P41266)


    Результаты выравнивания:
  • Файл Fasta
  • Jalview
  • Исследование зависимости E-value от объёма банка

    Добавив фильтр Viruses число результатов не изменилось, и поиск выдал старое значение - 18. Видимо попался тот редкий случай, когда все гомологи имеют нулевой E-value, ввиду чего невозможно вычислить долю вирусных последовательностей в SwissProt именно таким способом