Программы пакета BLAST для работы с нуклеотидными последовательностями.

1. Поиск в геноме участков, кодирующих белки, похожие на заданный.

Число находок с E-value < 0.001 2
E-value лучшей находки e-155
Название последовательности с лучшей находкой AL591982 Listeria monocytogenes strain EGD, complete genome, segment 10/12
Координаты лучшей находки (от-до) 82832-83800
Доля последовательности вашего белка, вошедшая в выравнивание с лучшей находкой 100%

2. Нахождение записи EMBL по последовательности программой BLASTN.

a) Данная мне последовательность присутствует в EM_PRO:AB000519 записи EMBL.
б) координаты заданной последовательности в записи : 571 - 750, соответствующая записи.
в)Поле FT содержит описание участка, включающий данную последовательности: ген SOX, направление совпадает с направлением участка (прямое).

FT   source          1..1557
FT                   /organism="Streptomyces sp."
FT                   /strain="H-7775"
FT                   /mol_type="genomic DNA"
FT                   /db_xref="taxon:1931"
FT   CDS             211..1473
FT                   /codon_start=1
FT                   /transl_table=11
FT                   /gene="SOX"
FT                   /product="sorbitol oxidase"
FT                   /function="sorbitol metabolism"
FT                   /db_xref="GOA:P97011"
FT                   /db_xref="InterPro:IPR006094"
FT                   /db_xref="InterPro:IPR007173"
FT                   /db_xref="InterPro:IPR016166"
FT                   /db_xref="InterPro:IPR016168"
FT                   /db_xref="UniProtKB/TrEMBL:P97011"
FT                   /protein_id="BAA19135.1"
FT                   /translation="MTPAEKNWAGNITFGAKRLCVPRSVRELRETVAASGAVRPLGTRH
FT                   SFNTVADTSGDHVSLAGLPRVVDIDVPGRAVSLSAGLRFGEFAAELHARGLALANLGSL
FT                   PHISVAGAVATGTHGSGVGNRSLAGAVRALSLVTADGETRTLRRTDEDFAGAVVSLGAL
FT                   GVVTSLELDLVPAFEVRQWVYEDLPEATLAARFDEVMSAAYSVSVFTDWRPGPVGQVWL
FT                   KQRVGDEGARSVMPAEWLGARLADGPRHPVPGMPAGNCTAQQGVPGPWHERLPHFRMEF
FT                   TPSNGDELQSEYFVARADAVAAYEALARLRDRIAPVLQVSELRTVAADDLWLSPAHGRD
FT                   SVAFHFTWVPDAAAVAPVAGAIEEALAPFGARPHWGKVFSTAPEVLRTLYPRYADFEEL
FT                   VGRHDPEGTFRNAFLDRYFRR"
	    

3. Поиск гомологов гена программой BLASTN.

В записи Swiss-Prot выбираем запись EMBL x73124, в которой вырезаем участок с координатиами 91234 - 92205 с помощью команды: seqret X73124.embl -sask в файл gene.fasta.
Далее выполним поиск гомологов гена в геноме бактерии L.monocytogenes: blastn -query gene.fasta -db lm -out result_blastn.txt -evalue 0.001 -task blastn . Результатом этого поиска является файл result_blastn.txt, на основе которого заполним таблицу:
Число находок с E-value < 0.001 1
E-value лучшей находки 3e-138
Название последовательности с лучшей находкой AL591982 Listeria monocytogenes strain EGD, complete genome, segment 10/12
Координаты лучшей находки (от-до) 82832-83794
Доля последовательности вашего белка, вошедшая в выравнивание с лучшей находкой 99,7%(969 из 971)

При поиске с одинаковым значением E-value = 0.001 программа tblastn дает 2 результата, однако программа blastn дала всего 1 результат, где было использовано 99,7% всей длины. Из этого можно сделать вывод, что программа tblastn более предназначена для данных целей.


© Anna Butusova,2012