Поиск организма по фрагменту нуклеотидной последовательности
Последовательность:
>24
ctgtcgaggatcaacgccgaccttaaaaaggcgaaggtcagcatcatcgggatatccaac
gacctcacgttcaccgactatttagaccccagggttaagtcctcgctgggcgaggaagag
atcatattcccgccatacaacgccgaccagctgcgagacattttggagcagcggagcaag
atggccttcaaggataacaccctggagccggcggtgatcccgctgtgcgcggcgttcgcg
gcccaggagcacggcgacgcccggaaggcgctggacctgctccgagtttctgccgagctg
Поиск гомолога белка человека в слоне
C помощью программы blastn, алгоритма megablast было определено:
Accession: NC_013665
Organism: Methanocella paludicola SANAE
координаты данного фрагмента в записи: 1145- 1444
кодирующий: cell division control protein 6 homolog [Methanocella paludicola SANAE]
Чтобы получить полный список белков человека, идентификаторы которых начинаются с определенной буквы,
использовала команду EMBOSS: infoseq sw:xb_human -only -name -desc -out file_name.txt.
Файл с последовательностью белка с идентификатором BTF3_HUMAN получила используя команду
seqret sw:btf3_human -auto
При поиске сайта выбрала чекбокс "spliced translated nucleotide search", что позволило искать белок полностью.
Было получено 8 хитов, выбрала лучшую находку.
>BTF3_HUMAN P20290 Transcription factor BTF3 (RNA polymerase B transcription factor 3)
MRRTGAPAQADSRGRGRARGGCPGGEATLSQPPPRGGTRGQEPQMKETIMNQEKLAKLQA
QVRIGGKGTARRKKKVVHRTATADDKKLQFSLKKLGVNNISGIEEVNMFTNQGTVIHFNN
PKVQASLAANTFTITGHAETKQLTEMLPSILNQLGADSLTSLRRLAEALPKQSVDGKAPL
ATGEDDDDEVPDLVENFDEASKNEAN
Алгоритм | Число находок e-value<0.001 | Параметры |
megablast | 71 | длина слова = 28 match/mismatch = 1/-2 |
blastn | 100 | длина слова = 11 match/mismatch = 2/-3 (параметры по умолчанию) |
blastn | 100 | длина слова = 7 match/mismatch = 1/-1 |