Задание 1.
По заданному 300-нуклеотидному фрагменту, используя программу megablast, определил, из генома какой бактерии или археи взят данный фрагмент.
Программу megablast запустил на сайте NCBI, выбрав нуклеотидный blast (blastn) и указав алгоритм "megablast" (он стоит по умолчанию).
В качестве банка выбрал "refseq_genomic". Ограничил поиск бактериями и археями. В разделе Filters and Masking убрал галочку с параметра Low complexity regions.
Организм - Methanococcus voltae, AC записи RefSeq - NC_014222.1, координаты данного фрагмента в записи 1145 - 1444, он является некодирующим.
Задание 2.
Для получения списка белков, идентификаторы которых начинаются с буквы "R", была использованна команда: infoseq sw:r*_human -only -name -desc -out r_protein.txt
Файл с последовательностью белка с идентификатором RYA13_HUMAN был получен командой seqret sw:RYA13_human -auto
.
При поиске гомолого белка RYA13_HUMAN, был использован сайт ENA Sequence Search. Поиск производился с параметрами "spliced translated nucleotide search", для поиска "цельного" белка, а не отдельных экзонов. В ходе поиска была получена таблица на сайте. Из нее видно, что было полученно 7 гомологов белка RYA13_HUMAN, из них есть одно имеющее лучшее e-value - это "0". Подробности о находке: e-value 0, identity 90, координаты найденного гена 8833294 - 8753813, количество интронов - 21.
Задание 3.
Для последовательности изолейциновой тРНК бактерии Mycobacterium leprae TN выполнен поиск гомологичных последовательностей
внутри порядка Actinomycetales.
Файл NC_002677.frn содержит аннотированные последовательности генома. Из этого файла
вырезана последовательность изолейциновой тРНК. Вот ее последовательность
ref|NC_002677|:12194-12270|Ile tRNA| [gene=ileT] [locus_tag=MLt01] GGGCCTATAGCTCAGGCGGTTAGAGCACTTCGCTGATAACGAAGAGGTCGGAGGTTCGAGTCCTCCTAGGCCCACAA
Последнее обновление: 16.09.2014