| На главную |
|
Мои проекты | Ссылки | Обо мне | Мои заметки |
Online BLAST
Поиск организма по фрагменту нуклеотидной последовательности
С помощью пограммы megablast определили, какому организму принадлежит заданный фрагмент генома. Результат работы программы представлен в таблице 1.
| Организм | AC записи RefSeq | Координаты | Кодирует ли что-то | Что кодирует |
| Haloquadratum walsbyi DSM 16790 | NC_008212 | 1145-1444 | Да | Orc1-type DNA replication protein |
Query 1 GACTGCTAGTGCTAAGTTTGTCAGTCAAGAATTGGAGTCGACATCTCAAAAGTATGATGT 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1145 GACTGCTAGTGCTAAGTTTGTCAGTCAAGAATTGGAGTCGACATCTCAAAAGTATGATGT 1204
Query 61 TGCATGTGAAGTCGAATATATTAATTGTGAGGTGACTGATACACAGTATCGCGTGCTTGC 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1205 TGCATGTGAAGTCGAATATATTAATTGTGAGGTGACTGATACACAGTATCGCGTGCTTGC 1264
Query 121 ACAGCTTGCAAATAAGTTTATCGAGAAAAATCGAAATCAGATCGATAAGCGGATTGATGA 180
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1265 ACAGCTTGCAAATAAGTTTATCGAGAAAAATCGAAATCAGATCGATAAGCGGATTGATGA 1324
Query 181 ATTAAAAACTCTTCAATCGAGTGATCAATACCTTTCTGGTTCCGCTTCATCAGCAGAATC 240
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1325 ATTAAAAACTCTTCAATCGAGTGATCAATACCTTTCTGGTTCCGCTTCATCAGCAGAATC 1384
Query 241 GATAGATTCAGTAGATACAGCTGATGATACGATCTCAAAATCACCTGATGAATCAACGGG 300
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct 1385 GATAGATTCAGTAGATACAGCTGATGATACGATCTCAAAATCACCTGATGAATCAACGGG 1444
Поиск гомолога белка человека в слоне
Для работы был выбран белок человека KAT6A_HUMAN, который является гистоновой ацетилтрансферазой.
Его последовательностьДалее при помощи сервиса EMBL ENA искали гомологи этого белка в геноме слона. Результаты этого представлены в таблице 2.
Таблица 2. Данные лучшей находки гомолога белка человека KAT6A_HUMAN в геноме африканского слона.| e-value | Длина | Identity | Координаты | Количество интронов |
| 6E-129 | 310 | 68% | 56950082->56951026 | 0 |
Само выравнивание:
Query 1695 ProProGlnGlnGlnProProLeuSerGlnCysSerMetAsnAsnSerPheThrProAla 1714
||||||.........! !! !|||:!!|||||||||||| ! !!:!||||||||| !!
ProProSerSerSerGlnGlnLeuAlaGlnCysSerMetAlaAlaAsnPheThrProPro
Sbjct 56950082 CCTCCGAGCAGCAGCCAGCAGCTGGCTCAGTGTAGCATGGCTGCTAACTTCACCCCGCCG 56950141
Query 1715 ProMetIleMetGluIleProGluSerGlySerThrGlyAsnIleSerIleTyrGluArg 1734
!..!:!: ||||||||||||!!!|||!:!.!! ||||||.!!:!!|||||||||
MetGlnLeuAlaGluIleProGluThrGlyAsnAla---AsnIleGlyLeuTyrGluArg
Sbjct 56950142 ATGCAGCTGGCCGAGATCCCCGAGACAGGCAACGCC---AACATTGGCTTATACGAACGG 56950198
Query 1735 Ile<->ProGlyAspPheGlyAlaGlySerTyrSerGlnProSerAlaThrPheSerLeu 1753
!!: ! !.!!||||||||||||||| !||| !!||||||||||||||||||||||||
MetGlyGlnSerAspPheGlyAlaGlyHisTyrProGlnProSerAlaThrPheSerLeu
Sbjct 56950199 ATGGGTCAAAGTGATTTTGGGGCTGGGCATTACCCGCAGCCGTCAGCCACCTTCAGCCTT 56950258
Query 1754 AlaLysLeuGlnGlnLeuThrAsnThrIleMetAspProHisAlaMetProTyrSerHis 1773
|||||||||||||||||||||||||||:!!!!:||| |||:!!:!!||||||||||||
AlaLysLeuGlnGlnLeuThrAsnThrLeuIleAsp---HisSerLeuProTyrSerHis
Sbjct 56950259 GCCAAACTACAGCAGTTAACTAATACCCTTATTGAT---CATTCATTGCCTTACAGCCAT 56950315
Query 1774 SerProAlaValThrSerTyrAlaThrSerValSerLeuSer<-><-><-><->AsnThr 1789
||| !!||||||||||||||||||!.!|||!.!||||||||| ||||||
SerAlaAlaValThrSerTyrAlaAsnSerAlaSerLeuSerThrProLeuSerAsnThr
Sbjct 56950316 TCCGCTGCTGTAACTTCCTATGCAAACAGTGCCTCTTTGTCTACACCGTTAAGTAACACA 56950375
Query 1790 GlyLeuAlaGlnLeuAlaProSer<->HisProLeuAlaGlyThrProGlnAlaGlnAla 1808
||||||!.!||||||:!!! !||| ||| !!:!! !!||| !|||||||||||||||
GlyLeuValGlnLeuSerGlnSerProHisSerValProGlyGlyProGlnAlaGlnAla
Sbjct 56950376 GGGCTTGTTCAGCTTTCTCAGTCTCCACACTCTGTCCCTGGGGGACCCCAAGCACAAGCT 56950435
Query 1809 ThrMetThrProProProAsnLeuAlaSerThrThrMetAsnLeuThrSerProLeuLeu 1828
||||||||||||||||||||||||.!! !! !! !!||||||||| !! !!|||||||||
ThrMetThrProProProAsnLeuThrProProProMetAsnLeuProProProLeuLeu
Sbjct 56950436 ACCATGACCCCACCCCCCAACCTGACTCCTCCTCCCATGAATCTGCCACCACCTCTTTTG 56950495
Query 1829 GlnCysAsnMetSerAlaThrAsnIleGlyIleProHisThrGlnArgLeuGlnGlyGln 1848
||| ! ||||||:!!|||:!!|||||||||||| !!|||!:!|||||||||||| !|||
GlnArgAsnMetAlaAlaSerAsnIleGlyIleSerHisSerGlnArgLeuGlnThrGln
Sbjct 56950496 CAACGGAACATGGCTGCATCAAATATTGGCATCTCCCACAGCCAAAGACTGCAAACTCAG 56950555
Query 1849 MetProValLysGlyHisIleSerIleArgSerLysSerAlaProLeu<->ProSerAla 1867
!!: !! !|||||||||:!!|||!!:|||!!!||||||||| !!||| |||:!!.!!
IleAlaSerLysGlyHisValSerMetArgThrLysSerAlaSerLeuSerProAlaThr
Sbjct 56950556 ATTGCCAGCAAGGGCCACGTCTCCATGAGAACCAAATCGGCATCTCTGTCACCAGCCACT 56950615
Query 1868 AlaAlaHisGlnGlnGlnLeuTyrGlyArgSerProSerAlaValAlaMetGlnAlaGly 1887
|||.!!||||||..!|||:!!||||||||||||! !!!! ||||||||||||!.! !
AlaThrHisGlnSerGlnIleTyrGlyArgSerGlnThr---ValAlaMetGlnGlyPro
Sbjct 56950616 GCCACCCATCAGTCGCAAATCTATGGGCGCTCCCAGACT---GTAGCCATGCAGGGTCCT 56950672
Query 1888 ProArgAlaLeuAlaValGlnArgGlyMetAsnMetGlyValAsnLeuMetProThrPro 1907
!!|||.!!|||.!!:!!||||||||||||||||||.!!|||||||||||||||.!!|||
AlaArgThrLeuThrMetGlnArgGlyMetAsnMetSerValAsnLeuMetProAlaPro
Sbjct 56950673 GCGCGGACTTTAACAATGCAAAGAGGCATGAACATGAGTGTGAACCTGATGCCAGCCCCA 56950732
Query 1908 AlaTyrAsnValAsnSer<-><->MetAsnMetAsnThrLeuAsnAlaMetAsnSerTyr 1925
|||||||||||||||||| ||||||||||||||||||||||||||||||.!!|||
AlaTyrAsnValAsnSerValAsnMetAsnMetAsnThrLeuAsnAlaMetAsnGlyTyr
Sbjct 56950733 GCCTACAATGTCAACTCTGTGAACATGAACATGAACACGCTCAATGCCATGAATGGGTAC 56950792
Query 1926 ArgMetThrGlnProMetMetAsnSerSerTyrHisSerAsnProAlaTyrMetAsnGln 1945
!!!|||:!!||||||||||||||||||.!!||||||||||||! !!.!||||||||||||
SerMetSerGlnProMetMetAsnSerGlyTyrHisSerAsnHisGlyTyrMetAsnGln
Sbjct 56950793 AGCATGTCCCAGCCGATGATGAACAGTGGCTACCACAGCAACCACGGCTACATGAATCAG 56950852
Query 1946 ThrAlaGlnTyrProMetGlnMetGlnMetGlyMetMetGlySerGlnAlaTyrThrGln 1965
||| !!||||||||||||||||||||||||||||||||||||!!!||| !!|||.!!|||
ThrProGlnTyrProMetGlnMetGlnMetGlyMetMetGlyThrGlnProTyrAlaGln
Sbjct 56950853 ACGCCCCAGTACCCTATGCAGATGCAGATGGGCATGATGGGAACCCAGCCATATGCCCAG 56950912
Query 1966 GlnProMetGlnProAsnProHisGlyAsnMetMetTyrThrGlyProSerHisHisSer 1985
|||||||||||| !! ||||||||||||||||||||||||!.!|||.!!||||||.!!
GlnProMetGlnThrProProHisGlyAsnMetMetTyrThrAlaProGlyHisHisGly
Sbjct 56950913 CAGCCAATGCAGACCCCACCCCACGGTAACATGATGTACACAGCCCCCGGACACCACGGC 56950972
Query 1986 TyrMetAsnAlaAlaGlyValProLysGlnSerLeuAsnGlyProTyrMetArgArg 2004
||||||||| .!!|||:!! !!|||||||||||||||||| !!||||||||||||
TyrMetAsn---ThrGlyMetSerLysGlnSerLeuAsnGlySerTyrMetArgArg
Sbjct 56950973 TACATGAAC---ACAGGCATGTCGAAACAATCTCTCAACGGGTCCTACATGAGAAGG 56951026
Поиск некодирующих последовательностей программой BLAST
В геноме заданной бактерии была найдена последовательность Met-tRNA. Затем искали гомологи данной последовательности тремя разными алгоритмами по всем бактериям, относящимся к тому же порядку, что и Thioalkalivibrio_sulfidophilus
. Алгоритм и число находок число находок с e-value < 0,001 занесены в таблицу 3.
| Алгоритм | Число находок с e-value < 0,001 |
| megablast | 3 |
| blastn с параметрами по умолчанию | 113 |
| blastn с длиной слова = 7, match/mismatch = 1/-1 | 114 |
Наименьшее число результатов дал алгорить megablast, чего от него и следовало ожидать, так как он направлен на поиск ближайших гомологов. Намного больше результатов дал алгоритм blastn, который позволяет искать более дальние гомологи. В данном случае megablast дал находки с identity не ниже 94%, что говорит об очень близком родстве.