Анализ генов Yarrowia lipolytica с помощью BLAST

Идентификатор выбранной последовательности: CR382127.1 (хромосома А референсного генома).

Координаты выбранного участка: 702500..710000. Схема расположения элементов в выбранном участке показана на рисунке 1.

Рисунок 1. Схема расположения аннотированных элементов в выбранном фрагменте.

?

В этом фрагменте находятся два гена: YALI0_A07238g и YALI0_A07249g.

Поиск BLAST

Megablast используется для поиска очень похожих последовательностей. Поэтому с использованием этого алгоритма поиск проводился по таксону Yarrowia lipolytica, т.е. среди штаммов этого вида. Длина слова была взята по умолчанию 28. Было найдено 64 последовательности.

С помощью blastn проводился поиск по таксону семейству Alloascoideaceae. Это семейства из порядка Saccharomycetales, куда входит Yarrowia lipolytica. Длина слова была взята по умолчанию 7. Было найдено 2 результата.

Для того, чтобы найти гомологи белков, закодированных в последовательности, был проведён поиск с помощью blastx. Сначала был проведён поиск по порядку Saccharomycetales с максимальным числом находок 100. Было найдено ровно 100 находок, из которых большая часть относилась к Yarrowia lipolytica. Тогда был проведён повторный поиск с максимальным числом находок 1000 и по тому же таксону, но за исключением Yarrowia lipolytica. Длина слова была взята по умолчанию 5. Было получено 272 находки.

База данных tblastx используется для поиска по транслированной нуклеотидной базе данных. Это позволяет обойти проблему вырожденности генетического кода. Поиск проводился по семейству Alloascoideaceae. Длина слова была уменьшина с 3 по умолчанию до 3. Ничего не было найдено. Вероятно, две последовательности, которые были найдены с помощью blastn, не были найдены, так как они частичные: partial cds.

Поиск отдалённых гомологов рРНК

16s рРНК отвечает за связывание с последовательностью Шайна-Дальгарно. 28s рРНК осуществляет пептидил-трансферазную реакцию. Обе они несут структурную функцию, а их взаимодействие обеспечивает соединение большой и малой субъединиц рибосомы.

Эти рРНК характерны для прокариот. В данном задании проводилсяя поиск их гомологов у Yarrowia lipolytica

Для поиска гомологов использовалась следующая команда. Алгоритм blastn был выбрано потому, что поиск идет по последовательности рРНК, а не белка, и при этом последовательности сильно различаются.

 blastn -task blastn -query query.fasta -db db.fasta -out blast.out  -word_size 7 -outfmt 7

Результаты работы команды можно скачать по ссылкам:

Гомологи 16s рРНК

Гомологи 23s рРНК

Было получено 7 находок для 16s и 11 находок 23s рРНК, но все они имеют большой e-value, поэтому они не являются гомологами исследуемых рРНК.

Все эти гены не являются генами рРНК. Это в основном белки с не совсем изученными функциями. Например, находка CAG79399.1 - это Yarrowia lipolytica Acetoacetyl-CoA thiolase. Должны были найтись 18S и 25S рРНК.