Химическое строение нуклеиновых кислот


Третий семестр

Главная



Задание 1.
По заданному 300-нуклеотидному фрагменту, используя программу megablast, определил, из генома какой бактерии или археи взят данный фрагмент. Программу megablast запустил на сайте NCBI, выбрав нуклеотидный blast (blastn) и указав алгоритм "megablast" (он стоит по умолчанию). В качестве банка выбрал "refseq_genomic". Ограничил поиск бактериями и археями. В разделе Filters and Masking убрал галочку с параметра Low complexity regions. Организм - Methanococcus voltae, AC записи RefSeq - NC_014222.1, координаты данного фрагмента в записи 1145 - 1444, он является некодирующим.

Задание 2.

Для получения списка белков, идентификаторы которых начинаются с буквы "R", была использованна команда: infoseq sw:r*_human -only -name -desc -out r_protein.txt

Файл с последовательностью белка с идентификатором RYA13_HUMAN был получен командой seqret sw:RYA13_human -auto.

При поиске гомолого белка RYA13_HUMAN, был использован сайт ENA Sequence Search. Поиск производился с параметрами "spliced translated nucleotide search", для поиска "цельного" белка, а не отдельных экзонов. В ходе поиска была получена таблица на сайте. Из нее видно, что было полученно 7 гомологов белка RYA13_HUMAN, из них есть одно имеющее лучшее e-value - это "0". Подробности о находке: e-value 0, identity 90, координаты найденного гена 8833294 - 8753813, количество интронов - 21.

Задание 3.
Для последовательности изолейциновой тРНК бактерии Mycobacterium leprae TN выполнен поиск гомологичных последовательностей внутри порядка Actinomycetales. Файл NC_002677.frn содержит аннотированные последовательности генома. Из этого файла вырезана последовательность изолейциновой тРНК. Вот ее последовательность

ref|NC_002677|:12194-12270|Ile tRNA| [gene=ileT] [locus_tag=MLt01] GGGCCTATAGCTCAGGCGGTTAGAGCACTTCGCTGATAACGAAGAGGTCGGAGGTTCGAGTCCTCCTAGGCCCACAA


Поиск гомологов этой тРНК внутри порядка Actinomycetales в банке данных refseq_genomic произведен тремя способами:
С использованием алгоритма megablast: найдено 158 последовательности, у всех находок e-value < 0,001 (самое большое значение e-value - 3e-11).
С использованием алгоритма blastn (параметры по умолчанию): всего найдено 458 последовательностей, 380 из них имеют e-value < 0,001.
С использованием алгоритма blastn (максимально чувствительные параметры из доступных: длина слова = 7, match/mismatch = 1/-1): всего найдено 844 последовательности, 413 из них имеют e-value < 0,001.


Видно, что самый строгий алгоритм - это megablast, потому что с его помощью найдено меньше всего гомологов, и все они хорошие. С максимально чувствительными параметрами blastn находится почти в два раза больше последовательностей, чем с тем же алгоритмом, но с параметрами по умолчанию. При этом хороших находок у обоих запусков примерное одинаковое (различие в 33 штуки).


© Рябых Григорий, 2014

Последнее обновление: 16.09.2014