Поиск организма по фрагменту нуклеотидной последовательности

В ходе работы по заданному 300-нуклеотидному фрагменту при использовании программы megablast был определен, к какому организму принадлежит данный фрагмент:

>15
cagtaggcataactaaacataacgaattgagaaaacagcaatgaaaaaacaatttatcca
aaaacaacaacaaatcagcttcgtaaaatcattcttttcccgccaattagagcaacaact
tggcttgatcgaagtccaggctcctattttgagccgtgtgggtgatggaacccaagataa
cctttctggttctgagaaagcggtacaggtaaaagttaagtcattgccggattcaacttt
tgaagttgtacattcattagcgaagtggaaacgtaaaaccttagggcgttttgattttgg
		

Программа megablast запускается на сайте NCBI, выбран нуклеотидный blast (blastn) и указан алгоритм "megablast" (он же стоит по умолчанию).

Далее приведены некоторые найденные сведения:

Поиск гомолога белка человека в слоне

В данном разделе приведена информация о гомологе белка человека P2RX1_HUMAN (AC в Swiss-Prot: P51575) в африканском слоне.

Была получена последовательность данного белка:

>P2RX1_HUMAN P51575 P2X purinoceptor 1 (P2X1) (ATP receptor) (Purinergic receptor)
MARRFQEELAAFLFEYDTPRMVLVRNKKVGVIFRLIQLVVLVYVIGWVFLYEKGYQTSSG
LISSVSVKLKGLAVTQLPGLGPQVWDVADYVFPAQGDNSFVVMTNFIVTPKQTQGYCAEH
PEGGICKEDSGCTPGKAKRKAQGIRTGKCVAFNDTVKTCEIFGWCPVEVDDDIPRPALLR
EAENFTLFIKNSISFPRFKVNRRNLVEEVNAAHMKTCLFHKTLHPLCPVFQLGYVVQESG
QNFSTLAEKGGVVGITIDWHCDLDWHVRHCRPIYEFHGLYEEKNLSPGFNFRFARHFVEN
GTNYRHLFKVFGIRFDILVDGKAGKFDIIPTMTTIGSGIGIFGVATVLCDLLLLHILPKR
HYYKQKKFKYAEDMGPGAAERDLAATSSTLGLQENMRTS
		

На сайте ENA был проведен онлайн-поиск гомолога этого белка в геноме африканского слона (был выставлен параметр spliced translated nucleotide search – это позволит искать не отдельные экзоны, а белок полностью). Далее приведена некоторая информация о выравнивании (для лучшей находки):

Поиск некодирующих последовательностей программой BLAST

Данный раздел поиску гомологов тРНК бактерии Xylanimonas cellulosilytica среди бактерий того же порядка (order) - Actinomycetales.

Полный геном можно найти в EMBL (EMBL AC: CP001821), запись Xylanimonas cellulosilytica DSM 15894, complete genome.

Для работы была выбрана лейциновая тРНК, которая кодируется последовательностью генома: 12491..12567. Далее приведен кодирующий участок:

	
>CP001821 CP001821.1 Xylanimonas cellulosilytica DSM 15894, complete genome.
ggggctatagctcaggcggttagagcgcttcgctgataacgaagaggtccgaggttcaag
tcctcgtagccccacca

BLAST проводился тремя разными способами. Далее приведены результаты поисков.

a. Поиск с алгоритмом megablast;

Количество результатов с e-value <0,001: 137

b. Поиск с алгоритмом blastn с параметрами по умолчанию;

Количество результатов с e-value <0,001: 253

c. Поиск с алгоритмом blastn с длиной слова = 7, match/mismatch = 1/-1 (максимально чувствительные параметры, доступные на сайте)

Количество результатов с e-value <0,001: 257


Типы поиска были выбраны по уменьшению "чувствительности": алгоритм megablast ищет только сильно похожие последовательности, а blastn включает в выдачу и менее похожие, поэтому число находок уменьшается.

Следует отметить, что для любого варианта поиска выходит большое количество хитов. Это связано с тем, что порядок, к которому принадлежит изучаемая бактерия, содержит большое число видов.


		


Последнее изменение: 25-11-2013 (pankevich-ev)