Практикум №8

Задание 1

У моего организма (Danio rerio) ген, кодирующий δ-субъединицу АТФ-синтазы расположен на 22ой хромосоме. Идентификатор белка, кодируемого этим геном: NP_956262.1, также по ссылке можно ознакомиться с последовательностью найденного белка.

После того, как был найден идентификатор нуклеотидной последовательности - NC_007133.7, на сайте NCBI Nucleotide при помощи Graphics был получен нуклеотидный фрагмент небольшой окрестности данного гена (тк длина генома данного организма 1.4 млрд.п.о., то фрагмент сравнительно небольшой - несколько тысяч нуклеотидов): 18764138-18780830. Файл с фрагментом можно посмотреть по ссылке.

Задание 2

В данном задании было нужно при помощи BLAST проверить, насколько консервативен ген, кодирующий δ-субъединицу АТФ-синтазы. Для этого был выбран далекий от моего организма таксон. Так как мой организм относится ко вторичноротым, я выбрал первичноротых, а именно пауков Aranae (taxid:6893).

Я провел поиск двумя методами: blastn и tblastn.

Blastn

Данный метод осуществляет поиск по нуклеотидной последовательности, сравнивая соответсвующие гены различных организмов.

Поиск производился по базе данных RefSeq Genome Database (refseq_genomes), в нее входило 4 сборки.

Параметры:Expect threshold 10; Word size 11; filter low complexity regions; Mask for lookup table only.

Результатом выдачи программы стало 2989 находок, но большая часть из них относится к одним и тем же организмам, то есть находок много, но разнообразие организмов сравнительно небольшое. Количество находок оказалось большим, чем я ожидал, но очень многие из них не имеют маленького E-value, что в принципе говорит о том, что такие находки не очень ценны.

Файл с выдачей программы по ссылке

Tblastn

Данный метод осуществляет поиск по последовательности белка, сравнивая с другими транслированными последовательностями.

Поиск производился по базе данных RefSeq Genome Database (refseq_genomes), в неё входило также всего 4 сборки.

Параметры:Expect threshold 5; Word size 3; filter low complexity regions.

Результатом выдачи программы стало всего 4 находки, в файле с выдачей их 10, потому что было несколько выравниваний белковой последовательности с несколькими различными участками одного организма. Я ожидал увидеть больше находок, но в силу отдаленности таксономических групп, результат выглядит правдоподобно.

Файл с выдачей программы по ссылке

Задание 3

Для данного задания использовались последовательности 16sрРнк и 23sрРнк, рРНК необходимы для поддержания структуры и работы рибосом. 23s рРнк отвечает за реакцию роста пептидной, а 16s рРнк учавствует в связывании с мРнк.

Использовались следующие команды

makeblastdb -in C:\Users\gskri\Downloads\GRCz11_genomic.fna -dbtype nucl
blastn -task blastn -query C:\Users\gskri\Downloads\16s.fna -db C:\Users\gskri\Downloads\GRCz11_genomic.fna -out 16s_blast -outfmt 7
Blastn является наиболее подходящим, так как при помощи него удобнее всего сравнивать нуклеотидные последовательности, по сравнению с другими программами, которые, например, осуществляют поиск по белковой последовательности.

Файлы с выдачей программы blastn16s рРНК Blastn; 23s рРНК Blastn.

Для 16s рРнк обнаружено 34 находки, было найдено 3 гомолога, 18s рРнк и 12s рРнк (она находятся в митохондриальном геноме Danio rerio, то есть 12s входит в состав митохондриальной рибососмы).

Для 18s рРнк обнаружено 95 находок, есть гомологи: 28s рРнк-их было найдено 4. Аннотация есть, совпадает с ожиданиями, но на одной из хромомсом на искомом участке была неописанная длинная некодирующая РНК.