Поиск организма по фрагменту нуклеотидной последовательности
Мне была дана следующая нуклеотидная последовательность. При помощи алгоритма megablast на сайте NCBI в банке refseq_genomic был произведен поиск организмов с такой последовательностью. Было выдано два
результата:
Рис.1 Результаты работы программы megablast по поиску 300 нуклеотидного фрагмента последовательности в базе refseq_genomic
Одна из последовательностей полностью идентична нашей (Candidatus Sulcia muelleri CARI chromosome, com plete genome), так что это и есть нужная последовательность.
Поиск гомолога белка человека в слоне
В следующщем задании необходимо было взять белок, идентификатор которого и моя фамилия начинаются с максимального количества одинаковых букв. К сожалению, совпадения нашлись только по первой букве (так уж повезло с
фамилией), поэтому в итоге я выбрал белок SSPN_HUMAN. Для получения списка всех последовательностей, начинающихся с S из генома человека была использована команда EMBOSS: infoseq sw:s*_human -only -name -desc -out file_name.txt, а для
получения выбранной последовательности использовалась команда seqret sw:SSPN_human -auto. Последовательность можно скачать здесь.
Далее был произведен поиск гомологов этого белка в геноме африканского слона. Была выбрана находка с E-Value 3E-123, Identity 90% и длиной выравнивания 242 нуклеотида. Координаты гена в геноме слона 15895953->15934922, 2 интрона.
Поиск некодирующих последовательностей программой BLAST
Сначала найдем все гены, кодирующие РНК в геноме данной мне бактерии Flavobacterium johnsoniae UW101 . NCBI выдает 66 результатов. Для выполнения задания я выбрал данный ген.
Затем я провел поиск гомологичных последовательностей с использованием megablast и blastn.
Megablast: 33 находки из того же порядка, все со скором ниже 0.001.
Blastn: 101 находка, blastn с параметрами минимальная длина слов 16, счета за матчи/мисматчи 1/-1: 214 находок.