Онлайн BLAST


Поиск организма по фрагменту нуклеотидной последовательности

С помощью программы megablast по заданному 300-нуклеотидному фрагменту была найдена следующая информация:

организм AC записи RefSeq координаты данного фрагмента в записичто именно кодирует
Methanothermobacter thermautotrophicus str. Delta H NC_000916.1 1145-1444 некодирующий

Ниже приведено выравнивание на основании которого составлялась предыдущая таблица.
Methanothermobacter thermautotrophicus str. Delta H chromosome, complete genome
Sequence ID: ref|NC_000916.1|Length: 1751377Number of Matches: 1

Score	Expect	Identities	Gaps	Strand
555 bits(300)	7e-154	300/300(100%)	0/300(0%)	Plus/Plus
Query  1     ATGTCATGATGGTTGATAACCAGAAAAATTCCCCCACAGAGGGGATGGAGGTCTCAACTC  60
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1145  ATGTCATGATGGTTGATAACCAGAAAAATTCCCCCACAGAGGGGATGGAGGTCTCAACTC  1204

Query  61    CCGTCACAATCCTTGAGGTTCCACCCCTGACAGTGATGGCTGTGAGGACCTACGAAAAGA  120
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1205  CCGTCACAATCCTTGAGGTTCCACCCCTGACAGTGATGGCTGTGAGGACCTACGAAAAGA  1264

Query  121   CCAGCAGGGGTCTCAAGACCCTAGGTGAGGTCCTCGCAACAGAGACAAAGGATGACCTCA  180
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1265  CCAGCAGGGGTCTCAAGACCCTAGGTGAGGTCCTCGCAACAGAGACAAAGGATGACCTCA  1324

Query  181   GGAGGAAACTCACCCCACCTGCAGATGACTACGACCAGGAAGCAGCCATTGAGAAGATAA  240
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1325  GGAGGAAACTCACCCCACCTGCAGATGACTACGACCAGGAAGCAGCCATTGAGAAGATAA  1384

Query  241   GATCAAACATGGAGTACGTTGCAGATGTGAGGGTCATAGTCCACACAAACCCACGACTTG  300
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1385  GATCAAACATGGAGTACGTTGCAGATGTGAGGGTCATAGTCCACACAAACCCACGACTTG  1444



Поиск гомолога белка человека в слоне

Был выбран белок человека, идентификатор которого в Swiss-Prot:BTF3_HUMAN.
Чтобы получить полный список белков человека, идентификаторы которых начинаются с определенной буквы, использовалась следующая команду EMBOSS:

 infoseq sw:b*_human -only -name -desc -out proteins_b.txt
Последовательность данного белка получена с помощью команды:
seqret sw:BTF3_HUMAN -auto
На сайте ENA был проведен поиск гомолога этого белка в геноме африканского слона (Loxodonta africana). При поиске на сайте ENA выбран чекбокс "spliced translated nucleotide search" – это позволило искать не отдельные экзоны, а белок полностью. В таблице ниже приведена информация о лучшей находке.
e-valueдлина выравниванияidentityкоординаты в геноме слонаколичество интронов
5E-641637995435030<-954345410
Выравнивание для лучшей находки:
       44 : GlnMetLysGluThrIleMetAsnGlnGluLysLeuAlaLysLeuGlnAlaGln :       61
            :!!!!:||||||! !|||||||||||||||||||||||||||||||||||||||
            LysIleLysGluMetIleMetAsnGlnGluLysLeuAlaLysLeuGlnAlaGln
 95435030 : AAGATAAAAGAAATGATCATGAATCAAGAGAAACTCGCCAAACTGCAGGCACAA : 95434979

       62 : ValArgIleGlyGlyLysGlyThrAlaArgArgLysLysLysValVal-HisAr :       79
            :!! !!||||||||||||||||||!.! !!||||||||||||||||||#|||||
            MetCysIleGlyGlyLysGlyThrValCysArgLysLysLysValVal#HisAr
 95434978 : ATGTGCATTGGTGGAAAAGGAACTGTTTGCAGAAAGAAGAAGGTGGTTTCATAG : 95434924

       80 : gThrAlaThrAlaAspAspLysLysLeuGlnPheSerLeuLysLysLeuGlyVa :       97
            |||||||! !.!!|||:!!||||||  !  ! !!  !||||||:!!:!!|||||
            gThrAlaIleThrAspAsnLysLysThrLeuValLeuLeuLysGluIleGlyVa
 95434923 : AACAGCTATAACAGATAATAAAAAAACTTTAGTTCTCCTTAAAGAAATAGGGGT : 95434870

       98 : lAsnAsnIleSerGlyIleGluGluValAsnMetPheThrAsnGlnGlyThrVa :      115
            ||||!.!|||||||||||||||||||||||||||||||||||||||||||||!.
            lAsnThrIleSerGlyIleGluGluValAsnMetPheThrAsnGlnGlyThrAl
 95434869 : AAACACTATCTCTGGTATTGAAGAGGTGAATATGTTTACAAACCAAGGAACAGC : 95434816

      116 : lIleHisPheAsnAsnProLysValGlnAlaSerLeuAlaAlaAsnThrPheTh :      133
            !||||||!!.|||||||||:!!||||||||||||||||||||||||||||||||
            aIleHisLeuAsnAsnProGluValGlnAlaSerLeuAlaAlaAsnThrPheTh
 95434815 : GATCCACTTAAACAATCCTGAAGTTCAGGCATCTCTGGCAGCAAACACTTTCAC : 95434762

      134 : rIleThrGlyHisAlaGluThrLysGlnLeuThrGluMetLeuProSerIleLe :      151
            |! !|||||| !!|||||||||||||||||||||! !!!:||||||||||||||
            rThrThrGlyAspAlaGluThrLysGlnLeuThrGlyIleLeuProSerIleLe
 95434761 : CACTACCGGCGATGCTGAGACAAAGCAGCTGACAGGAATACTACCCAGCATCTT : 95434708

      152 : uAsnGlnLeuGlyAlaAspSerLeuThrSerLeuArgArgLeuAlaGluAlaLe :      169
            |!:!||||||.!!||||||||||||||||||! !||| !!||||||:!!|||||
            uSerGlnLeuSerAlaAspSerLeuThrSer***ArgGlyLeuAlaGlnAlaLe
 95434707 : AAGCCAGCTCAGTGCAGACAGTCTGACTAGTTAAAGAGGACTGGCCCAAGCTCT : 95434654

      170 : uProLysGlnSerValAspGlyLysAlaProLeuAlaThrGlyGluAspAspAs :      187
            ||||||||||! !|||||||||||||||||||||||||||||||||||||||||
            uProLysGlnTyrValAspGlyLysAlaProLeuAlaThrGlyGluAspAspAs
 95434653 : GCCCAAACAATATGTGGATGGAAAAGCACCACTGGCTACTGGAGAGGATGATGA : 95434600

      188 : pAspGluValProAspLeuValGluAsnPheAspGluAlaSerLysAsnGluAl :      205
            |||||||||||||! !||||||! !|||||||||||||||||||||!:!|||||
            pAspGluValProGlyLeuValGlyAsnPheAspGluAlaSerLysSerGluAl
 95434599 : TGATGAAGTTCCAGGCCTTGTGGGGAATTTTGATGAGGCATCCAAGAGTGAGGC : 95434546

      206 : aAsn :      206
            ||||
            aAsn
 95434545 : AAAC : 95434541



Поиск некодирующих последовательностей программой BLAST

В отдельный файл была вырезана последовательность tRNA-Arg из генома бактерии Finegoldia magna:

ID   AP008971_105; parent: AP008971
AC   AP008971;
FT   tRNA            124693..124768
FT                   /locus_tag="FMG_tRNA01"
FT                   /product="tRNA-Arg"
SQ   Sequence    76 BP;
     GCTTCCATAA TTAAGCTGGA TATAATACCC CCCTCCTAAG GGGGCATCCC CGGTTCGAAT        60
     CCGGGTGGGA GTACCA                                                        76
//
Был проведен поиск гомологов данной последовательности по всем бактериям, относящимся к порядку Clostridiales.
В таблице ниже указано число находок с e-value < 0,001. Поиск проводился по базе RefSec тремя разными вариантами:
алгоритмчисло находок с e-value < 0,001
megablast2 (оба хита принадлежат исходной бактерии)
blastn с параметрами по умолчанию6 (один из хитов исходная последовательность)
blastn с длиной слова = 7, match/mismatch = 1/-1 24 (один из хитов исходная последовательность)