Online BLAST

Поиск организма по фрагменту нуклеотидной последовательности

С помощью пограммы megablast определили, какому организму принадлежит заданный фрагмент генома. Результат работы программы представлен в таблице 1.

Таблица 1. Результат поиска BLAST по алгоритму megablast в базе данных RefSeq.
Организм AC записи RefSeq Координаты Кодирует ли что-то Что кодирует
Haloquadratum walsbyi DSM 16790 NC_008212 1145-1444 Да Orc1-type DNA replication protein

 Query  1     GACTGCTAGTGCTAAGTTTGTCAGTCAAGAATTGGAGTCGACATCTCAAAAGTATGATGT  60
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1145  GACTGCTAGTGCTAAGTTTGTCAGTCAAGAATTGGAGTCGACATCTCAAAAGTATGATGT  1204

Query  61    TGCATGTGAAGTCGAATATATTAATTGTGAGGTGACTGATACACAGTATCGCGTGCTTGC  120
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1205  TGCATGTGAAGTCGAATATATTAATTGTGAGGTGACTGATACACAGTATCGCGTGCTTGC  1264

Query  121   ACAGCTTGCAAATAAGTTTATCGAGAAAAATCGAAATCAGATCGATAAGCGGATTGATGA  180
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1265  ACAGCTTGCAAATAAGTTTATCGAGAAAAATCGAAATCAGATCGATAAGCGGATTGATGA  1324

Query  181   ATTAAAAACTCTTCAATCGAGTGATCAATACCTTTCTGGTTCCGCTTCATCAGCAGAATC  240
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1325  ATTAAAAACTCTTCAATCGAGTGATCAATACCTTTCTGGTTCCGCTTCATCAGCAGAATC  1384

Query  241   GATAGATTCAGTAGATACAGCTGATGATACGATCTCAAAATCACCTGATGAATCAACGGG  300
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  1385  GATAGATTCAGTAGATACAGCTGATGATACGATCTCAAAATCACCTGATGAATCAACGGG  1444 

Поиск гомолога белка человека в слоне

Для работы был выбран белок человека KAT6A_HUMAN, который является гистоновой ацетилтрансферазой.

Его последовательность

Далее при помощи сервиса EMBL ENA искали гомологи этого белка в геноме слона. Результаты этого представлены в таблице 2.

Таблица 2. Данные лучшей находки гомолога белка человека KAT6A_HUMAN в геноме африканского слона.
e-value Длина Identity Координаты Количество интронов
6E-129 310 68% 56950082->56951026 0

Само выравнивание:
Query 1695      ProProGlnGlnGlnProProLeuSerGlnCysSerMetAsnAsnSerPheThrProAla 1714     
                 ||||||.........! !! !|||:!!||||||||||||  !  !!:!||||||||| !!
                 ProProSerSerSerGlnGlnLeuAlaGlnCysSerMetAlaAlaAsnPheThrProPro
 Sbjct 56950082  CCTCCGAGCAGCAGCCAGCAGCTGGCTCAGTGTAGCATGGCTGCTAACTTCACCCCGCCG 56950141 

 Query 1715      ProMetIleMetGluIleProGluSerGlySerThrGlyAsnIleSerIleTyrGluArg 1734     
                   !..!:!:   ||||||||||||!!!|||!:!.!!   ||||||.!!:!!|||||||||
                 MetGlnLeuAlaGluIleProGluThrGlyAsnAla---AsnIleGlyLeuTyrGluArg
 Sbjct 56950142  ATGCAGCTGGCCGAGATCCCCGAGACAGGCAACGCC---AACATTGGCTTATACGAACGG 56950198 

 Query 1735      Ile<->ProGlyAspPheGlyAlaGlySerTyrSerGlnProSerAlaThrPheSerLeu 1753     
                 !!:   ! !.!!|||||||||||||||  !||| !!||||||||||||||||||||||||
                 MetGlyGlnSerAspPheGlyAlaGlyHisTyrProGlnProSerAlaThrPheSerLeu
 Sbjct 56950199  ATGGGTCAAAGTGATTTTGGGGCTGGGCATTACCCGCAGCCGTCAGCCACCTTCAGCCTT 56950258 

 Query 1754      AlaLysLeuGlnGlnLeuThrAsnThrIleMetAspProHisAlaMetProTyrSerHis 1773     
                 |||||||||||||||||||||||||||:!!!!:|||   |||:!!:!!||||||||||||
                 AlaLysLeuGlnGlnLeuThrAsnThrLeuIleAsp---HisSerLeuProTyrSerHis
 Sbjct 56950259  GCCAAACTACAGCAGTTAACTAATACCCTTATTGAT---CATTCATTGCCTTACAGCCAT 56950315 

 Query 1774      SerProAlaValThrSerTyrAlaThrSerValSerLeuSer<-><-><-><->AsnThr 1789     
                 ||| !!||||||||||||||||||!.!|||!.!|||||||||            ||||||
                 SerAlaAlaValThrSerTyrAlaAsnSerAlaSerLeuSerThrProLeuSerAsnThr
 Sbjct 56950316  TCCGCTGCTGTAACTTCCTATGCAAACAGTGCCTCTTTGTCTACACCGTTAAGTAACACA 56950375 

 Query 1790      GlyLeuAlaGlnLeuAlaProSer<->HisProLeuAlaGlyThrProGlnAlaGlnAla 1808     
                 ||||||!.!||||||:!!! !|||   ||| !!:!! !!|||  !|||||||||||||||
                 GlyLeuValGlnLeuSerGlnSerProHisSerValProGlyGlyProGlnAlaGlnAla
 Sbjct 56950376  GGGCTTGTTCAGCTTTCTCAGTCTCCACACTCTGTCCCTGGGGGACCCCAAGCACAAGCT 56950435 

 Query 1809      ThrMetThrProProProAsnLeuAlaSerThrThrMetAsnLeuThrSerProLeuLeu 1828     
                 ||||||||||||||||||||||||.!! !! !! !!||||||||| !! !!|||||||||
                 ThrMetThrProProProAsnLeuThrProProProMetAsnLeuProProProLeuLeu
 Sbjct 56950436  ACCATGACCCCACCCCCCAACCTGACTCCTCCTCCCATGAATCTGCCACCACCTCTTTTG 56950495 

 Query 1829      GlnCysAsnMetSerAlaThrAsnIleGlyIleProHisThrGlnArgLeuGlnGlyGln 1848     
                 ||| ! ||||||:!!|||:!!|||||||||||| !!|||!:!||||||||||||  !|||
                 GlnArgAsnMetAlaAlaSerAsnIleGlyIleSerHisSerGlnArgLeuGlnThrGln
 Sbjct 56950496  CAACGGAACATGGCTGCATCAAATATTGGCATCTCCCACAGCCAAAGACTGCAAACTCAG 56950555 

 Query 1849      MetProValLysGlyHisIleSerIleArgSerLysSerAlaProLeu<->ProSerAla 1867     
                 !!: !!  !|||||||||:!!|||!!:|||!!!||||||||| !!|||   |||:!!.!!
                 IleAlaSerLysGlyHisValSerMetArgThrLysSerAlaSerLeuSerProAlaThr
 Sbjct 56950556  ATTGCCAGCAAGGGCCACGTCTCCATGAGAACCAAATCGGCATCTCTGTCACCAGCCACT 56950615 

 Query 1868      AlaAlaHisGlnGlnGlnLeuTyrGlyArgSerProSerAlaValAlaMetGlnAlaGly 1887     
                 |||.!!||||||..!|||:!!||||||||||||! !!!!   ||||||||||||!.!  !
                 AlaThrHisGlnSerGlnIleTyrGlyArgSerGlnThr---ValAlaMetGlnGlyPro
 Sbjct 56950616  GCCACCCATCAGTCGCAAATCTATGGGCGCTCCCAGACT---GTAGCCATGCAGGGTCCT 56950672 

 Query 1888      ProArgAlaLeuAlaValGlnArgGlyMetAsnMetGlyValAsnLeuMetProThrPro 1907     
                  !!|||.!!|||.!!:!!||||||||||||||||||.!!|||||||||||||||.!!|||
                 AlaArgThrLeuThrMetGlnArgGlyMetAsnMetSerValAsnLeuMetProAlaPro
 Sbjct 56950673  GCGCGGACTTTAACAATGCAAAGAGGCATGAACATGAGTGTGAACCTGATGCCAGCCCCA 56950732 

 Query 1908      AlaTyrAsnValAsnSer<-><->MetAsnMetAsnThrLeuAsnAlaMetAsnSerTyr 1925     
                 ||||||||||||||||||      ||||||||||||||||||||||||||||||.!!|||
                 AlaTyrAsnValAsnSerValAsnMetAsnMetAsnThrLeuAsnAlaMetAsnGlyTyr
 Sbjct 56950733  GCCTACAATGTCAACTCTGTGAACATGAACATGAACACGCTCAATGCCATGAATGGGTAC 56950792 

 Query 1926      ArgMetThrGlnProMetMetAsnSerSerTyrHisSerAsnProAlaTyrMetAsnGln 1945     
                 !!!|||:!!||||||||||||||||||.!!||||||||||||! !!.!||||||||||||
                 SerMetSerGlnProMetMetAsnSerGlyTyrHisSerAsnHisGlyTyrMetAsnGln
 Sbjct 56950793  AGCATGTCCCAGCCGATGATGAACAGTGGCTACCACAGCAACCACGGCTACATGAATCAG 56950852 

 Query 1946      ThrAlaGlnTyrProMetGlnMetGlnMetGlyMetMetGlySerGlnAlaTyrThrGln 1965     
                 ||| !!||||||||||||||||||||||||||||||||||||!!!||| !!|||.!!|||
                 ThrProGlnTyrProMetGlnMetGlnMetGlyMetMetGlyThrGlnProTyrAlaGln
 Sbjct 56950853  ACGCCCCAGTACCCTATGCAGATGCAGATGGGCATGATGGGAACCCAGCCATATGCCCAG 56950912 

 Query 1966      GlnProMetGlnProAsnProHisGlyAsnMetMetTyrThrGlyProSerHisHisSer 1985     
                 |||||||||||| !!   ||||||||||||||||||||||||!.!|||.!!||||||.!!
                 GlnProMetGlnThrProProHisGlyAsnMetMetTyrThrAlaProGlyHisHisGly
 Sbjct 56950913  CAGCCAATGCAGACCCCACCCCACGGTAACATGATGTACACAGCCCCCGGACACCACGGC 56950972 

 Query 1986      TyrMetAsnAlaAlaGlyValProLysGlnSerLeuAsnGlyProTyrMetArgArg 2004     
                 |||||||||   .!!|||:!! !!|||||||||||||||||| !!||||||||||||
                 TyrMetAsn---ThrGlyMetSerLysGlnSerLeuAsnGlySerTyrMetArgArg
 Sbjct 56950973  TACATGAAC---ACAGGCATGTCGAAACAATCTCTCAACGGGTCCTACATGAGAAGG 56951026 

Поиск некодирующих последовательностей программой BLAST

В геноме заданной бактерии была найдена последовательность Met-tRNA. Затем искали гомологи данной последовательности тремя разными алгоритмами по всем бактериям, относящимся к тому же порядку, что и Thioalkalivibrio_sulfidophilus . Алгоритм и число находок число находок с e-value < 0,001 занесены в таблицу 3.
Алгоритм Число находок с e-value < 0,001
megablast 3
blastn с параметрами по умолчанию 113
blastn с длиной слова = 7, match/mismatch = 1/-1 114

Наименьшее число результатов дал алгорить megablast, чего от него и следовало ожидать, так как он направлен на поиск ближайших гомологов. Намного больше результатов дал алгоритм blastn, который позволяет искать более дальние гомологи. В данном случае megablast дал находки с identity не ниже 94%, что говорит об очень близком родстве.

Сравнение программ BLASTN и MegaBLAST

В случает алгоритма BLASTN мы видим больше находок и они включают в себя находки по алгоритму MegaBLAST. Это большее число находок отличается большим видовым разнообразием, чем 3 находки другого алгоритма. Выравнивания длиннее, но могут быть хуже. Выравнивания же MegaBLAST не могут быть хуже, потому что по умолчанию длина слова там 28.


© Ходыкина Наталья,2013