Назад на страницу семестра
Для поиска гомологов в геноме Amoeboaphelidium protococcarum были выбраны субъединица 1 цитохромоксидазы COX1, белок малой субъединицы рибосомы S9-A (RS9A) и фактор элонгации транскрипции SPT6 Saccharomyces cerevisiae.
Последовательности белков были получены следующей командой (здесь и далее примеры для COX1):
seqret sw:P00401 -outseq "COX1_YEAST.fasta"
Далее из файла с геномом, скопированного в личную директорию, была создана база данных для blast:
makeblastdb -in X5.fasta -dbtype "nucl"
После этого был осуществлён поиск гомологов с помощью tblastn:
tblastn -query COX1_YEAST.fasta -db X5.fasta -out COX1.txt
-outfmt "7 qaccver saccver qstart qend sstart send length qcovs pident gapopen evalue"
Для двух других белков sstart и send не указывались за ненадобностью.
Выравнивания были получены с помощью:
tblastn -query COX1_YEAST.fasta -db X5.fasta -out COX1_a.txt
COX1: находки; выравнивания.
Четыре расположенных рядом фрагмента обратной цепи unplaced-887 покрывают в сумме 94% белка с e-value порядка от 10^(-4) до 10^(-70) и идентичностью 40-58%. При этом соответствующие им фрагменты COX1 идут друг за другом в той же последовательности. Из этого можно сделать вывод, что найдено 4 экзона или группы экзонов, кодирующих гомологичный белок.
Другие находки не являются гомологичными белками, т.к. имеют малое покрытие и/или большое e-value.
RS9A: находки; выравнивания.
Два почти идентичных участка скэффолдов 693 и 243 покрывают без гэпов 86% белка, совпадая с ним на 75% с e-value порядка 10^(-78) - 10^(-79). Можно утверждать, что это гомологичные белки.
Два других участка с малым e-value - в скэффолдах 17 и 444 - покрывают 66% белка с идентичностью 27% и также очень похожи между собой, однако, учитывая две предыдущие находки, было бы логичнее предположить, что они кодируют не гомологичный белок, а, например, его паралог.
SPT6: находки; выравнивания.
Участок скэффолда 282 покрывает 80% белка с идентичностью 32% и e-value порядка 10^(-81). Вероятно, это гомолог.