Онлайн BLAST
Поиск организма по фрагменту нуклеотидной последовательности
С помощью программы megablast по заданному 300-нуклеотидному фрагменту была найдена следующая информация:
| организм | AC записи RefSeq | координаты данного фрагмента в записи | что именно кодирует |
| Methanothermobacter thermautotrophicus str. Delta H | NC_000916.1 | 1145-1444 | некодирующий |
Ниже приведено выравнивание на основании которого составлялась предыдущая таблица.
Methanothermobacter thermautotrophicus str. Delta H chromosome, complete genome
Sequence ID: ref|NC_000916.1|Length: 1751377Number of Matches: 1
Score Expect Identities Gaps Strand
555 bits(300) 7e-154 300/300(100%) 0/300(0%) Plus/Plus
Query 1 ATGTCATGATGGTTGATAACCAGAAAAATTCCCCCACAGAGGGGATGGAGGTCTCAACTC 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1145 ATGTCATGATGGTTGATAACCAGAAAAATTCCCCCACAGAGGGGATGGAGGTCTCAACTC 1204
Query 61 CCGTCACAATCCTTGAGGTTCCACCCCTGACAGTGATGGCTGTGAGGACCTACGAAAAGA 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1205 CCGTCACAATCCTTGAGGTTCCACCCCTGACAGTGATGGCTGTGAGGACCTACGAAAAGA 1264
Query 121 CCAGCAGGGGTCTCAAGACCCTAGGTGAGGTCCTCGCAACAGAGACAAAGGATGACCTCA 180
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1265 CCAGCAGGGGTCTCAAGACCCTAGGTGAGGTCCTCGCAACAGAGACAAAGGATGACCTCA 1324
Query 181 GGAGGAAACTCACCCCACCTGCAGATGACTACGACCAGGAAGCAGCCATTGAGAAGATAA 240
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1325 GGAGGAAACTCACCCCACCTGCAGATGACTACGACCAGGAAGCAGCCATTGAGAAGATAA 1384
Query 241 GATCAAACATGGAGTACGTTGCAGATGTGAGGGTCATAGTCCACACAAACCCACGACTTG 300
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1385 GATCAAACATGGAGTACGTTGCAGATGTGAGGGTCATAGTCCACACAAACCCACGACTTG 1444Поиск гомолога белка человека в слоне
Был выбран белок человека, идентификатор которого в Swiss-Prot:BTF3_HUMAN.
Чтобы получить полный список белков человека, идентификаторы которых начинаются с определенной буквы, использовалась следующая команду EMBOSS:
infoseq sw:b*_human -only -name -desc -out proteins_b.txtПоследовательность данного белка получена с помощью команды:
seqret sw:BTF3_HUMAN -autoНа сайте ENA был проведен поиск гомолога этого белка в геноме африканского слона (Loxodonta africana). При поиске на сайте ENA выбран чекбокс "spliced translated nucleotide search" – это позволило искать не отдельные экзоны, а белок полностью. В таблице ниже приведена информация о лучшей находке.
| e-value | длина выравнивания | identity | координаты в геноме слона | количество интронов |
| 5E-64 | 163 | 79 | 95435030<-95434541 | 0 |
44 : GlnMetLysGluThrIleMetAsnGlnGluLysLeuAlaLysLeuGlnAlaGln : 61
:!!!!:||||||! !|||||||||||||||||||||||||||||||||||||||
LysIleLysGluMetIleMetAsnGlnGluLysLeuAlaLysLeuGlnAlaGln
95435030 : AAGATAAAAGAAATGATCATGAATCAAGAGAAACTCGCCAAACTGCAGGCACAA : 95434979
62 : ValArgIleGlyGlyLysGlyThrAlaArgArgLysLysLysValVal-HisAr : 79
:!! !!||||||||||||||||||!.! !!||||||||||||||||||#|||||
MetCysIleGlyGlyLysGlyThrValCysArgLysLysLysValVal#HisAr
95434978 : ATGTGCATTGGTGGAAAAGGAACTGTTTGCAGAAAGAAGAAGGTGGTTTCATAG : 95434924
80 : gThrAlaThrAlaAspAspLysLysLeuGlnPheSerLeuLysLysLeuGlyVa : 97
|||||||! !.!!|||:!!|||||| ! ! !! !||||||:!!:!!|||||
gThrAlaIleThrAspAsnLysLysThrLeuValLeuLeuLysGluIleGlyVa
95434923 : AACAGCTATAACAGATAATAAAAAAACTTTAGTTCTCCTTAAAGAAATAGGGGT : 95434870
98 : lAsnAsnIleSerGlyIleGluGluValAsnMetPheThrAsnGlnGlyThrVa : 115
||||!.!|||||||||||||||||||||||||||||||||||||||||||||!.
lAsnThrIleSerGlyIleGluGluValAsnMetPheThrAsnGlnGlyThrAl
95434869 : AAACACTATCTCTGGTATTGAAGAGGTGAATATGTTTACAAACCAAGGAACAGC : 95434816
116 : lIleHisPheAsnAsnProLysValGlnAlaSerLeuAlaAlaAsnThrPheTh : 133
!||||||!!.|||||||||:!!||||||||||||||||||||||||||||||||
aIleHisLeuAsnAsnProGluValGlnAlaSerLeuAlaAlaAsnThrPheTh
95434815 : GATCCACTTAAACAATCCTGAAGTTCAGGCATCTCTGGCAGCAAACACTTTCAC : 95434762
134 : rIleThrGlyHisAlaGluThrLysGlnLeuThrGluMetLeuProSerIleLe : 151
|! !|||||| !!|||||||||||||||||||||! !!!:||||||||||||||
rThrThrGlyAspAlaGluThrLysGlnLeuThrGlyIleLeuProSerIleLe
95434761 : CACTACCGGCGATGCTGAGACAAAGCAGCTGACAGGAATACTACCCAGCATCTT : 95434708
152 : uAsnGlnLeuGlyAlaAspSerLeuThrSerLeuArgArgLeuAlaGluAlaLe : 169
|!:!||||||.!!||||||||||||||||||! !||| !!||||||:!!|||||
uSerGlnLeuSerAlaAspSerLeuThrSer***ArgGlyLeuAlaGlnAlaLe
95434707 : AAGCCAGCTCAGTGCAGACAGTCTGACTAGTTAAAGAGGACTGGCCCAAGCTCT : 95434654
170 : uProLysGlnSerValAspGlyLysAlaProLeuAlaThrGlyGluAspAspAs : 187
||||||||||! !|||||||||||||||||||||||||||||||||||||||||
uProLysGlnTyrValAspGlyLysAlaProLeuAlaThrGlyGluAspAspAs
95434653 : GCCCAAACAATATGTGGATGGAAAAGCACCACTGGCTACTGGAGAGGATGATGA : 95434600
188 : pAspGluValProAspLeuValGluAsnPheAspGluAlaSerLysAsnGluAl : 205
|||||||||||||! !||||||! !|||||||||||||||||||||!:!|||||
pAspGluValProGlyLeuValGlyAsnPheAspGluAlaSerLysSerGluAl
95434599 : TGATGAAGTTCCAGGCCTTGTGGGGAATTTTGATGAGGCATCCAAGAGTGAGGC : 95434546
206 : aAsn : 206
||||
aAsn
95434545 : AAAC : 95434541
Поиск некодирующих последовательностей программой BLAST
В отдельный файл была вырезана последовательность tRNA-Arg из генома бактерии Finegoldia magna:
ID AP008971_105; parent: AP008971
AC AP008971;
FT tRNA 124693..124768
FT /locus_tag="FMG_tRNA01"
FT /product="tRNA-Arg"
SQ Sequence 76 BP;
GCTTCCATAA TTAAGCTGGA TATAATACCC CCCTCCTAAG GGGGCATCCC CGGTTCGAAT 60
CCGGGTGGGA GTACCA 76
// Был проведен поиск гомологов данной последовательности по всем бактериям, относящимся к порядку Clostridiales.В таблице ниже указано число находок с e-value < 0,001. Поиск проводился по базе RefSec тремя разными вариантами:
| алгоритм | число находок с e-value < 0,001 |
| megablast | 2 (оба хита принадлежат исходной бактерии) |
| blastn с параметрами по умолчанию | 6 (один из хитов исходная последовательность) |
| blastn с длиной слова = 7, match/mismatch = 1/-1 | 24 (один из хитов исходная последовательность) |