Онлайн BLAST
Поиск организма по фрагменту нуклеотидной последовательности
С помощью программы megablast по заданному 300-нуклеотидному фрагменту была найдена следующая информация:
организм | AC записи RefSeq | координаты данного фрагмента в записи | что именно кодирует |
Methanothermobacter thermautotrophicus str. Delta H | NC_000916.1 | 1145-1444 | некодирующий |
Ниже приведено выравнивание на основании которого составлялась предыдущая таблица.
Methanothermobacter thermautotrophicus str. Delta H chromosome, complete genome Sequence ID: ref|NC_000916.1|Length: 1751377Number of Matches: 1 Score Expect Identities Gaps Strand 555 bits(300) 7e-154 300/300(100%) 0/300(0%) Plus/Plus Query 1 ATGTCATGATGGTTGATAACCAGAAAAATTCCCCCACAGAGGGGATGGAGGTCTCAACTC 60 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1145 ATGTCATGATGGTTGATAACCAGAAAAATTCCCCCACAGAGGGGATGGAGGTCTCAACTC 1204 Query 61 CCGTCACAATCCTTGAGGTTCCACCCCTGACAGTGATGGCTGTGAGGACCTACGAAAAGA 120 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1205 CCGTCACAATCCTTGAGGTTCCACCCCTGACAGTGATGGCTGTGAGGACCTACGAAAAGA 1264 Query 121 CCAGCAGGGGTCTCAAGACCCTAGGTGAGGTCCTCGCAACAGAGACAAAGGATGACCTCA 180 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1265 CCAGCAGGGGTCTCAAGACCCTAGGTGAGGTCCTCGCAACAGAGACAAAGGATGACCTCA 1324 Query 181 GGAGGAAACTCACCCCACCTGCAGATGACTACGACCAGGAAGCAGCCATTGAGAAGATAA 240 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1325 GGAGGAAACTCACCCCACCTGCAGATGACTACGACCAGGAAGCAGCCATTGAGAAGATAA 1384 Query 241 GATCAAACATGGAGTACGTTGCAGATGTGAGGGTCATAGTCCACACAAACCCACGACTTG 300 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1385 GATCAAACATGGAGTACGTTGCAGATGTGAGGGTCATAGTCCACACAAACCCACGACTTG 1444
Поиск гомолога белка человека в слоне
Был выбран белок человека, идентификатор которого в Swiss-Prot:BTF3_HUMAN.
Чтобы получить полный список белков человека, идентификаторы которых начинаются с определенной буквы, использовалась следующая команду EMBOSS:
infoseq sw:b*_human -only -name -desc -out proteins_b.txtПоследовательность данного белка получена с помощью команды:
seqret sw:BTF3_HUMAN -autoНа сайте ENA был проведен поиск гомолога этого белка в геноме африканского слона (Loxodonta africana). При поиске на сайте ENA выбран чекбокс "spliced translated nucleotide search" – это позволило искать не отдельные экзоны, а белок полностью. В таблице ниже приведена информация о лучшей находке.
e-value | длина выравнивания | identity | координаты в геноме слона | количество интронов |
5E-64 | 163 | 79 | 95435030<-95434541 | 0 |
44 : GlnMetLysGluThrIleMetAsnGlnGluLysLeuAlaLysLeuGlnAlaGln : 61 :!!!!:||||||! !||||||||||||||||||||||||||||||||||||||| LysIleLysGluMetIleMetAsnGlnGluLysLeuAlaLysLeuGlnAlaGln 95435030 : AAGATAAAAGAAATGATCATGAATCAAGAGAAACTCGCCAAACTGCAGGCACAA : 95434979 62 : ValArgIleGlyGlyLysGlyThrAlaArgArgLysLysLysValVal-HisAr : 79 :!! !!||||||||||||||||||!.! !!||||||||||||||||||#||||| MetCysIleGlyGlyLysGlyThrValCysArgLysLysLysValVal#HisAr 95434978 : ATGTGCATTGGTGGAAAAGGAACTGTTTGCAGAAAGAAGAAGGTGGTTTCATAG : 95434924 80 : gThrAlaThrAlaAspAspLysLysLeuGlnPheSerLeuLysLysLeuGlyVa : 97 |||||||! !.!!|||:!!|||||| ! ! !! !||||||:!!:!!||||| gThrAlaIleThrAspAsnLysLysThrLeuValLeuLeuLysGluIleGlyVa 95434923 : AACAGCTATAACAGATAATAAAAAAACTTTAGTTCTCCTTAAAGAAATAGGGGT : 95434870 98 : lAsnAsnIleSerGlyIleGluGluValAsnMetPheThrAsnGlnGlyThrVa : 115 ||||!.!|||||||||||||||||||||||||||||||||||||||||||||!. lAsnThrIleSerGlyIleGluGluValAsnMetPheThrAsnGlnGlyThrAl 95434869 : AAACACTATCTCTGGTATTGAAGAGGTGAATATGTTTACAAACCAAGGAACAGC : 95434816 116 : lIleHisPheAsnAsnProLysValGlnAlaSerLeuAlaAlaAsnThrPheTh : 133 !||||||!!.|||||||||:!!|||||||||||||||||||||||||||||||| aIleHisLeuAsnAsnProGluValGlnAlaSerLeuAlaAlaAsnThrPheTh 95434815 : GATCCACTTAAACAATCCTGAAGTTCAGGCATCTCTGGCAGCAAACACTTTCAC : 95434762 134 : rIleThrGlyHisAlaGluThrLysGlnLeuThrGluMetLeuProSerIleLe : 151 |! !|||||| !!|||||||||||||||||||||! !!!:|||||||||||||| rThrThrGlyAspAlaGluThrLysGlnLeuThrGlyIleLeuProSerIleLe 95434761 : CACTACCGGCGATGCTGAGACAAAGCAGCTGACAGGAATACTACCCAGCATCTT : 95434708 152 : uAsnGlnLeuGlyAlaAspSerLeuThrSerLeuArgArgLeuAlaGluAlaLe : 169 |!:!||||||.!!||||||||||||||||||! !||| !!||||||:!!||||| uSerGlnLeuSerAlaAspSerLeuThrSer***ArgGlyLeuAlaGlnAlaLe 95434707 : AAGCCAGCTCAGTGCAGACAGTCTGACTAGTTAAAGAGGACTGGCCCAAGCTCT : 95434654 170 : uProLysGlnSerValAspGlyLysAlaProLeuAlaThrGlyGluAspAspAs : 187 ||||||||||! !||||||||||||||||||||||||||||||||||||||||| uProLysGlnTyrValAspGlyLysAlaProLeuAlaThrGlyGluAspAspAs 95434653 : GCCCAAACAATATGTGGATGGAAAAGCACCACTGGCTACTGGAGAGGATGATGA : 95434600 188 : pAspGluValProAspLeuValGluAsnPheAspGluAlaSerLysAsnGluAl : 205 |||||||||||||! !||||||! !|||||||||||||||||||||!:!||||| pAspGluValProGlyLeuValGlyAsnPheAspGluAlaSerLysSerGluAl 95434599 : TGATGAAGTTCCAGGCCTTGTGGGGAATTTTGATGAGGCATCCAAGAGTGAGGC : 95434546 206 : aAsn : 206 |||| aAsn 95434545 : AAAC : 95434541
Поиск некодирующих последовательностей программой BLAST
В отдельный файл была вырезана последовательность tRNA-Arg из генома бактерии Finegoldia magna:
ID AP008971_105; parent: AP008971 AC AP008971; FT tRNA 124693..124768 FT /locus_tag="FMG_tRNA01" FT /product="tRNA-Arg" SQ Sequence 76 BP; GCTTCCATAA TTAAGCTGGA TATAATACCC CCCTCCTAAG GGGGCATCCC CGGTTCGAAT 60 CCGGGTGGGA GTACCA 76 //Был проведен поиск гомологов данной последовательности по всем бактериям, относящимся к порядку Clostridiales.
В таблице ниже указано число находок с e-value < 0,001. Поиск проводился по базе RefSec тремя разными вариантами:
алгоритм | число находок с e-value < 0,001 |
megablast | 2 (оба хита принадлежат исходной бактерии) |
blastn с параметрами по умолчанию | 6 (один из хитов исходная последовательность) |
blastn с длиной слова = 7, match/mismatch = 1/-1 | 24 (один из хитов исходная последовательность) |