Практикум 8

Для выполнения заданий данного практикума в качестве эукариотического организма я выбрал Danio rerio (zebrafish). Я нашёл в файле с последовательностями белков последовательность дельта-субъединицу АТФ-синтазы. Идентификатор нуклеотидной записи, к которой относится ген, кодирующий данный белок, BC065042.1. файл с последовательностью небольшой окрестности этого гена в FASTA-формате

Я выполнил поиск последовательностей среди последовательностей представителей отряда пауков (так как мой организм - рыбка данио - относится к вторичноротым, а я очень люблю пауков) с помощью инструмента tblastn (так как белковая последовательность известна, а я хотел найти гомологи) по базе данных refseq_genomes (4 сборки) с настройками по умолчанию (длина слова 28). Выявилось 4 находки с примерно одинаковым (от 67 до 71) процентом сходства с заданной последовательностью. Так как рыбка данио и пауки отстоят друг от друга довольно далеко на дереве родства таксонов, я ожидал 0 находок. Ссылка на находки в текстовом виде Далее я выполнил поиск с помощью алгоритма megablast (так как я попытался картировать фрагмент нуклеотидной последовательности на геномы) по базе данных refseq_genomes (4 находки). . Вот, что получилось: для параметров по умолчанию (длина слова 28), для длины слова 16 и порогов 0.05, 0.10, 0.25 и даже 0.50 (понижает порог чувствительности и увеличивает число находок) последовательности не были найдены вовсе. Видимо, всё дело в том, что за время накопилось очень много синонимичных мутаций помимо некоторого числа несинонимичных, вследствие чего последовательности ДНК мутировали ещё сильнее, чем последовательности белков, в силу чего находок даже с такими параметрами не было найдено.

Файл с геномом рыбки слишком большой, поэтому я выбрал для задания 3 эукариота с более компактным геномом, чем у данио (например, C.elegans).

Основные функции 16S rRNA: 1) образует малую субъединицу бактериальной рибосомы; 2) связывается с последовательностью Шайна-Дальгарно, что важно для инициации трансляции; 3) структурная функция.

Основные функции 23S rRNA: 1) образует большую субъединицу бактериальной рибосомы; 2) обладает пептидилтрансферазной активностью; 3) структурная функция. Я ввёл следующую команду:

  makeblastdb -in  GCF_000002985.6_WBcel235_genomic.fasta -dbtype nucl 
Появилась база данных (я проиндексировал геном червя). Далее я скачал последовательности рРНК кишечной палочки. Далее я провёл локальный blastn (так как рРНК не кодируют белок). по этой базе данных с помощью команд (параметры указаны):
 blastn -task blastn -query 16S.fasta -db GCF_000002985.6_WBcel235_genomic.fasta -out 16s_rRNA_blastn.txt -outfmt 7 -evalue 0.05 
 blastn -task blastn -query 23S.fasta -db GCF_000002985.6_WBcel235_genomic.fasta -out 23s_rRNA_blastn.txt -outfmt 7 -evalue 0.05 
Было получено 4 хита для 16S rRNA (2 гомолога) и 7 хитов для 23S rRNA (5 гомологов). Видимо, их несколько, так как у эукариот есть ещё и митохондриальные рибосомы 70S помимо основных рибосом типа 80S. Вероятно, в силу гомологии, 16S rRNA выравнивается на 18S rRNA, а 23S rRNA на 28S rRNA. Аннотация совпадает с ожидаемой исходя из результатов поиска. Ссылки на файлы: 16s rRNA 23s rRNA