На главную |
|
Мои проекты | Ссылки | Обо мне | Мои заметки |
Online BLAST
Поиск организма по фрагменту нуклеотидной последовательности
С помощью пограммы megablast определили, какому организму принадлежит заданный фрагмент генома. Результат работы программы представлен в таблице 1.
Организм | AC записи RefSeq | Координаты | Кодирует ли что-то | Что кодирует |
Haloquadratum walsbyi DSM 16790 | NC_008212 | 1145-1444 | Да | Orc1-type DNA replication protein |
Query 1 GACTGCTAGTGCTAAGTTTGTCAGTCAAGAATTGGAGTCGACATCTCAAAAGTATGATGT 60 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1145 GACTGCTAGTGCTAAGTTTGTCAGTCAAGAATTGGAGTCGACATCTCAAAAGTATGATGT 1204 Query 61 TGCATGTGAAGTCGAATATATTAATTGTGAGGTGACTGATACACAGTATCGCGTGCTTGC 120 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1205 TGCATGTGAAGTCGAATATATTAATTGTGAGGTGACTGATACACAGTATCGCGTGCTTGC 1264 Query 121 ACAGCTTGCAAATAAGTTTATCGAGAAAAATCGAAATCAGATCGATAAGCGGATTGATGA 180 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1265 ACAGCTTGCAAATAAGTTTATCGAGAAAAATCGAAATCAGATCGATAAGCGGATTGATGA 1324 Query 181 ATTAAAAACTCTTCAATCGAGTGATCAATACCTTTCTGGTTCCGCTTCATCAGCAGAATC 240 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1325 ATTAAAAACTCTTCAATCGAGTGATCAATACCTTTCTGGTTCCGCTTCATCAGCAGAATC 1384 Query 241 GATAGATTCAGTAGATACAGCTGATGATACGATCTCAAAATCACCTGATGAATCAACGGG 300 |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||| Sbjct 1385 GATAGATTCAGTAGATACAGCTGATGATACGATCTCAAAATCACCTGATGAATCAACGGG 1444
Поиск гомолога белка человека в слоне
Для работы был выбран белок человека KAT6A_HUMAN, который является гистоновой ацетилтрансферазой.
Его последовательностьДалее при помощи сервиса EMBL ENA искали гомологи этого белка в геноме слона. Результаты этого представлены в таблице 2.
Таблица 2. Данные лучшей находки гомолога белка человека KAT6A_HUMAN в геноме африканского слона.e-value | Длина | Identity | Координаты | Количество интронов |
6E-129 | 310 | 68% | 56950082->56951026 | 0 |
Само выравнивание:
Query 1695 ProProGlnGlnGlnProProLeuSerGlnCysSerMetAsnAsnSerPheThrProAla 1714 ||||||.........! !! !|||:!!|||||||||||| ! !!:!||||||||| !! ProProSerSerSerGlnGlnLeuAlaGlnCysSerMetAlaAlaAsnPheThrProPro Sbjct 56950082 CCTCCGAGCAGCAGCCAGCAGCTGGCTCAGTGTAGCATGGCTGCTAACTTCACCCCGCCG 56950141 Query 1715 ProMetIleMetGluIleProGluSerGlySerThrGlyAsnIleSerIleTyrGluArg 1734 !..!:!: ||||||||||||!!!|||!:!.!! ||||||.!!:!!||||||||| MetGlnLeuAlaGluIleProGluThrGlyAsnAla---AsnIleGlyLeuTyrGluArg Sbjct 56950142 ATGCAGCTGGCCGAGATCCCCGAGACAGGCAACGCC---AACATTGGCTTATACGAACGG 56950198 Query 1735 Ile<->ProGlyAspPheGlyAlaGlySerTyrSerGlnProSerAlaThrPheSerLeu 1753 !!: ! !.!!||||||||||||||| !||| !!|||||||||||||||||||||||| MetGlyGlnSerAspPheGlyAlaGlyHisTyrProGlnProSerAlaThrPheSerLeu Sbjct 56950199 ATGGGTCAAAGTGATTTTGGGGCTGGGCATTACCCGCAGCCGTCAGCCACCTTCAGCCTT 56950258 Query 1754 AlaLysLeuGlnGlnLeuThrAsnThrIleMetAspProHisAlaMetProTyrSerHis 1773 |||||||||||||||||||||||||||:!!!!:||| |||:!!:!!|||||||||||| AlaLysLeuGlnGlnLeuThrAsnThrLeuIleAsp---HisSerLeuProTyrSerHis Sbjct 56950259 GCCAAACTACAGCAGTTAACTAATACCCTTATTGAT---CATTCATTGCCTTACAGCCAT 56950315 Query 1774 SerProAlaValThrSerTyrAlaThrSerValSerLeuSer<-><-><-><->AsnThr 1789 ||| !!||||||||||||||||||!.!|||!.!||||||||| |||||| SerAlaAlaValThrSerTyrAlaAsnSerAlaSerLeuSerThrProLeuSerAsnThr Sbjct 56950316 TCCGCTGCTGTAACTTCCTATGCAAACAGTGCCTCTTTGTCTACACCGTTAAGTAACACA 56950375 Query 1790 GlyLeuAlaGlnLeuAlaProSer<->HisProLeuAlaGlyThrProGlnAlaGlnAla 1808 ||||||!.!||||||:!!! !||| ||| !!:!! !!||| !||||||||||||||| GlyLeuValGlnLeuSerGlnSerProHisSerValProGlyGlyProGlnAlaGlnAla Sbjct 56950376 GGGCTTGTTCAGCTTTCTCAGTCTCCACACTCTGTCCCTGGGGGACCCCAAGCACAAGCT 56950435 Query 1809 ThrMetThrProProProAsnLeuAlaSerThrThrMetAsnLeuThrSerProLeuLeu 1828 ||||||||||||||||||||||||.!! !! !! !!||||||||| !! !!||||||||| ThrMetThrProProProAsnLeuThrProProProMetAsnLeuProProProLeuLeu Sbjct 56950436 ACCATGACCCCACCCCCCAACCTGACTCCTCCTCCCATGAATCTGCCACCACCTCTTTTG 56950495 Query 1829 GlnCysAsnMetSerAlaThrAsnIleGlyIleProHisThrGlnArgLeuGlnGlyGln 1848 ||| ! ||||||:!!|||:!!|||||||||||| !!|||!:!|||||||||||| !||| GlnArgAsnMetAlaAlaSerAsnIleGlyIleSerHisSerGlnArgLeuGlnThrGln Sbjct 56950496 CAACGGAACATGGCTGCATCAAATATTGGCATCTCCCACAGCCAAAGACTGCAAACTCAG 56950555 Query 1849 MetProValLysGlyHisIleSerIleArgSerLysSerAlaProLeu<->ProSerAla 1867 !!: !! !|||||||||:!!|||!!:|||!!!||||||||| !!||| |||:!!.!! IleAlaSerLysGlyHisValSerMetArgThrLysSerAlaSerLeuSerProAlaThr Sbjct 56950556 ATTGCCAGCAAGGGCCACGTCTCCATGAGAACCAAATCGGCATCTCTGTCACCAGCCACT 56950615 Query 1868 AlaAlaHisGlnGlnGlnLeuTyrGlyArgSerProSerAlaValAlaMetGlnAlaGly 1887 |||.!!||||||..!|||:!!||||||||||||! !!!! ||||||||||||!.! ! AlaThrHisGlnSerGlnIleTyrGlyArgSerGlnThr---ValAlaMetGlnGlyPro Sbjct 56950616 GCCACCCATCAGTCGCAAATCTATGGGCGCTCCCAGACT---GTAGCCATGCAGGGTCCT 56950672 Query 1888 ProArgAlaLeuAlaValGlnArgGlyMetAsnMetGlyValAsnLeuMetProThrPro 1907 !!|||.!!|||.!!:!!||||||||||||||||||.!!|||||||||||||||.!!||| AlaArgThrLeuThrMetGlnArgGlyMetAsnMetSerValAsnLeuMetProAlaPro Sbjct 56950673 GCGCGGACTTTAACAATGCAAAGAGGCATGAACATGAGTGTGAACCTGATGCCAGCCCCA 56950732 Query 1908 AlaTyrAsnValAsnSer<-><->MetAsnMetAsnThrLeuAsnAlaMetAsnSerTyr 1925 |||||||||||||||||| ||||||||||||||||||||||||||||||.!!||| AlaTyrAsnValAsnSerValAsnMetAsnMetAsnThrLeuAsnAlaMetAsnGlyTyr Sbjct 56950733 GCCTACAATGTCAACTCTGTGAACATGAACATGAACACGCTCAATGCCATGAATGGGTAC 56950792 Query 1926 ArgMetThrGlnProMetMetAsnSerSerTyrHisSerAsnProAlaTyrMetAsnGln 1945 !!!|||:!!||||||||||||||||||.!!||||||||||||! !!.!|||||||||||| SerMetSerGlnProMetMetAsnSerGlyTyrHisSerAsnHisGlyTyrMetAsnGln Sbjct 56950793 AGCATGTCCCAGCCGATGATGAACAGTGGCTACCACAGCAACCACGGCTACATGAATCAG 56950852 Query 1946 ThrAlaGlnTyrProMetGlnMetGlnMetGlyMetMetGlySerGlnAlaTyrThrGln 1965 ||| !!||||||||||||||||||||||||||||||||||||!!!||| !!|||.!!||| ThrProGlnTyrProMetGlnMetGlnMetGlyMetMetGlyThrGlnProTyrAlaGln Sbjct 56950853 ACGCCCCAGTACCCTATGCAGATGCAGATGGGCATGATGGGAACCCAGCCATATGCCCAG 56950912 Query 1966 GlnProMetGlnProAsnProHisGlyAsnMetMetTyrThrGlyProSerHisHisSer 1985 |||||||||||| !! ||||||||||||||||||||||||!.!|||.!!||||||.!! GlnProMetGlnThrProProHisGlyAsnMetMetTyrThrAlaProGlyHisHisGly Sbjct 56950913 CAGCCAATGCAGACCCCACCCCACGGTAACATGATGTACACAGCCCCCGGACACCACGGC 56950972 Query 1986 TyrMetAsnAlaAlaGlyValProLysGlnSerLeuAsnGlyProTyrMetArgArg 2004 ||||||||| .!!|||:!! !!|||||||||||||||||| !!|||||||||||| TyrMetAsn---ThrGlyMetSerLysGlnSerLeuAsnGlySerTyrMetArgArg Sbjct 56950973 TACATGAAC---ACAGGCATGTCGAAACAATCTCTCAACGGGTCCTACATGAGAAGG 56951026
Поиск некодирующих последовательностей программой BLAST
В геноме заданной бактерии была найдена последовательность Met-tRNA. Затем искали гомологи данной последовательности тремя разными алгоритмами по всем бактериям, относящимся к тому же порядку, что и Thioalkalivibrio_sulfidophilus
. Алгоритм и число находок число находок с e-value < 0,001 занесены в таблицу 3.
Алгоритм | Число находок с e-value < 0,001 |
megablast | 3 |
blastn с параметрами по умолчанию | 113 |
blastn с длиной слова = 7, match/mismatch = 1/-1 | 114 |
Наименьшее число результатов дал алгорить megablast, чего от него и следовало ожидать, так как он направлен на поиск ближайших гомологов. Намного больше результатов дал алгоритм blastn, который позволяет искать более дальние гомологи. В данном случае megablast дал находки с identity не ниже 94%, что говорит об очень близком родстве.