BLAST
Поиск организма по участку последовательности ДНК
Последовательность:
>17
agaccgttgctgagtactacaaaattaaagtcgctgacctgctttctaagcgccgctcgc
gctcggtagcgcgtccgcgtcaaatggcgatggcgatggctaaagagctgactaaccaca
gtttgccggagatcggcgacgcttttggtggtcgcgaccataccacggtacttcacgctt
gccgtaagattgagcaactgcgtgaagaaagccacgacatcaaagaagatttctcaaatc
tcatcagaacattatcttcgtgacgctatgaaatttattgttgaacgtgaacagttgcta
Результаты поиска:
- AC: HE617160.1
- Организм: Pantoea ananatis
- Координаты: 1145-1444
- Ген: dnaN
ATPаза участвующая в инициации репликации, является бета-субъединицей ДНК-полимеразы III
Гомолог гена
Ген: SUZ12_HUMAN
Последовательность белка:
>SUZ12_HUMAN Q15022 Polycomb protein SUZ12
MAPQKHGGGGGGGSGPSAGSGGGGFGGSAAVAAATASGGKSGGGSCGGGGSYSASSSSSA
AAAAGAAVLPVKKPKMEHVQADHELFLQAFEKPTQIYRFLRTRNLIAPIFLHRTLTYMSH
RNSRTNIKRKTFKVDDMLSKVEKMKGEQESHSLSAHLQLTFTGFFHKNDKPSPNSENEQN
SVTLEVLLVKVCHKKRKDVSCPIRQVPTGKKQVPLNPDLNQTKPGNFPSLAVSSNEFEPS
NSHMVKSYSLLFRVTRPGRREFNGMINGETNENIDVNEELPARRKRNREDGEKTFVAQMT
VFDKNRRLQLLDGEYEVAMQEMEECPISKKRATWETILDGKRLPPFETFSQGPTLQFTLR
WTGETNDKSTAPIAKPLATRNSESLHQENKPGSVKPTQTIAVKESLTTDLQTRKEKDTPN
ENRQKLRIFYQFLYNNNTRQQTEARDDLHCPWCTLNCRKLYSLLKHLKLCHSRFIFNYVY
HPKGARIDVSINECYDGSYAGNPQDIHRQPGFAFSRNGPVKRTPITHILVCRPKRTKASM
SEFLESEDGEVEQQRTYSSGHNRLYFHSDTCLPLRPQEMEVDSEDEKDPEWLREKTITQI
EEFSDVNEGEKEVMKLWNLHVMKHGFIADNQMNHACMLFVENYGQKIIKKNLCRNFMLHL
VSMHDFNLISIMSIDKAVTKLREMQQKLEKGESASPANEEITEEQNGTANGFSEINSKEK
ALETDSVSGVSKQSKKQKL
Было найдено 2 хита:
- Оба выравнивания характеризуются высокой идентичностью (95-98%).
- E-Value находок: 2E-218 и 1E-179.
- Длина выравниваний: 35783 и 3690.
Белок оказался разбит на 2 участка, при этом,
позиции на хромосоме слона коллинеарны участкам белка. Оба хита лежат на одной контиге: loxAfr3:scaffold_31:1:29745944:1 REF.
Вероятно программа не правильно определила ген и оба хита следует
объединить в один ген.
Таким образом:
- Координаты гена: 1405493 - 1446699
- Количество интронов: 13-14
Дело в том, что кусок белка (401-427) был потерян между хитами. Возможно, он присутствует в геноме слона и просто не был замечем программой.
Однако, возможна и делеция этого экзона. Таким образом, если этого экзона нет, то в сумме 13 интронов, а если есть,- 14.
Поиск некодирующих последовательностей программой BLAST
- Организм:
Magnetococcus marinus MC-1
- Порядок:
Magnetococcales
Интересуемая последовательность: Метиониновая тРНК.
>ENA|CP000471|CP000471.1 Magnetococcus marinus MC-1, complete genome. : Location:1..76
TAAATGACCGATATAACGCGCGCGTTGCGTTCTTCTATCCATTGAGACCGGCACCGTTCC
CGAGTACCATGGGGTG
Результаты:
К сожалению, в порядке Magnetococcales всего 1 организм с секвенированным геномом,
поэтому любой из алгоритмов BLAST давал единственный хит - ту
самую тРНК.
Для проверки был взят другой организм:
- Организм:
Eggerthella lenta
- AC генома: CP001726.1
- Порядок:
Coriobacteriales
Интересуемая последовательность: Аргининовая тРНК.
>ENA|CP001726|CP001726.1 Eggerthella lenta DSM 2243, complete genome. : Location:1..77
AAACGCTACAATGCCTTTGAATGTTGCTGAAAAATGCTGAATATCGAATCTGAAAACGGA
ACACCATTGGACAACCA
Результаты:
- Алгоритм megablast:
2 хита
- Алгоритм blastn с параметрами по умолчанию:
2 хита
- Алгоритм blastn с длиной слова = 7, match/mismatch = 1/-1:
3 хита
© 2013; Sutormin Dmitry