Учебный Сайт Николая Николаева

Назад на страницу семестра

Entrez Direct, BLAST+, EMBOSS.

1. Поиск гомологов белков в неаннотированном геноме.

Для поиска гомологов в геноме Amoeboaphelidium protococcarum были выбраны субъединица 1 цитохромоксидазы COX1, белок малой субъединицы рибосомы S9-A (RS9A) и фактор элонгации транскрипции SPT6 Saccharomyces cerevisiae.

Последовательности белков были получены следующей командой (здесь и далее примеры для COX1):

     seqret sw:P00401 -outseq "COX1_YEAST.fasta"

Далее из файла с геномом, скопированного в личную директорию, была создана база данных для blast:

     makeblastdb -in X5.fasta -dbtype "nucl"

После этого был осуществлён поиск гомологов с помощью tblastn:

     tblastn -query COX1_YEAST.fasta -db X5.fasta -out COX1.txt
-outfmt "7 qaccver saccver qstart qend sstart send length qcovs pident gapopen evalue"

Для двух других белков sstart и send не указывались за ненадобностью.
Выравнивания были получены с помощью:

     tblastn -query COX1_YEAST.fasta -db X5.fasta -out COX1_a.txt

Описание результатов поиска

COX1: находки; выравнивания.

Четыре расположенных рядом фрагмента обратной цепи unplaced-887 покрывают в сумме 94% белка с e-value порядка от 10^(-4) до 10^(-70) и идентичностью 40-58%. При этом соответствующие им фрагменты COX1 идут друг за другом в той же последовательности. Из этого можно сделать вывод, что найдено 4 экзона или группы экзонов, кодирующих гомологичный белок.

Другие находки не являются гомологичными белками, т.к. имеют малое покрытие и/или большое e-value.

RS9A: находки; выравнивания.

Два почти идентичных участка скэффолдов 693 и 243 покрывают без гэпов 86% белка, совпадая с ним на 75% с e-value порядка 10^(-78) - 10^(-79). Можно утверждать, что это гомологичные белки.

Два других участка с малым e-value - в скэффолдах 17 и 444 - покрывают 66% белка с идентичностью 27% и также очень похожи между собой, однако, учитывая две предыдущие находки, было бы логичнее предположить, что они кодируют не гомологичный белок, а, например, его паралог.

SPT6: находки; выравнивания.

Участок скэффолда 282 покрывает 80% белка с идентичностью 32% и e-value порядка 10^(-81). Вероятно, это гомолог.