Поиск организма по фрагменту нуклеотидной последовательности
В ходе работы по заданному 300-нуклеотидному фрагменту при использовании программы megablast был определен, к какому организму принадлежит данный фрагмент:
>15 cagtaggcataactaaacataacgaattgagaaaacagcaatgaaaaaacaatttatcca aaaacaacaacaaatcagcttcgtaaaatcattcttttcccgccaattagagcaacaact tggcttgatcgaagtccaggctcctattttgagccgtgtgggtgatggaacccaagataa cctttctggttctgagaaagcggtacaggtaaaagttaagtcattgccggattcaacttt tgaagttgtacattcattagcgaagtggaaacgtaaaaccttagggcgttttgattttgg
Программа megablast запускается на сайте NCBI, выбран нуклеотидный blast (blastn) и указан алгоритм "megablast" (он же стоит по умолчанию).
Далее приведены некоторые найденные сведения:
- последовательность принадлежит организму Yersinia pestis;
- АС записи RefSeq: CP002956.1;
- координаты в геноме на обратной цепи(-): 1104338 - 1104637;
- последовательность кодирует часть гена аспарагин-синтазы:
CDS complement(1103605..1104597) /locus_tag="A1122_05145" /EC_number="6.3.1.1" /note="COG2502 Asparagine synthetase A" /codon_start=1 /transl_table=11 /product="asparagine synthetase AsnA" /protein_id="AEL71698.1" /db_xref="GI:342853145"
Поиск гомолога белка человека в слоне
В данном разделе приведена информация о гомологе белка человека P2RX1_HUMAN (AC в Swiss-Prot: P51575) в африканском слоне.
Была получена последовательность данного белка:
>P2RX1_HUMAN P51575 P2X purinoceptor 1 (P2X1) (ATP receptor) (Purinergic receptor) MARRFQEELAAFLFEYDTPRMVLVRNKKVGVIFRLIQLVVLVYVIGWVFLYEKGYQTSSG LISSVSVKLKGLAVTQLPGLGPQVWDVADYVFPAQGDNSFVVMTNFIVTPKQTQGYCAEH PEGGICKEDSGCTPGKAKRKAQGIRTGKCVAFNDTVKTCEIFGWCPVEVDDDIPRPALLR EAENFTLFIKNSISFPRFKVNRRNLVEEVNAAHMKTCLFHKTLHPLCPVFQLGYVVQESG QNFSTLAEKGGVVGITIDWHCDLDWHVRHCRPIYEFHGLYEEKNLSPGFNFRFARHFVEN GTNYRHLFKVFGIRFDILVDGKAGKFDIIPTMTTIGSGIGIFGVATVLCDLLLLHILPKR HYYKQKKFKYAEDMGPGAAERDLAATSSTLGLQENMRTS
На сайте ENA был проведен онлайн-поиск гомолога этого белка в геноме африканского слона (был выставлен параметр spliced translated nucleotide search – это позволит искать не отдельные экзоны, а белок полностью). Далее приведена некоторая информация о выравнивании (для лучшей находки):
- e-value: 3E-214;
- идентичность: 89%;
- координаты гена в геноме слона: 7553604<-7532460 (обратная цепь);
- количество интронов в гене слона: 11.
Поиск некодирующих последовательностей программой BLAST
Данный раздел поиску гомологов тРНК бактерии Xylanimonas cellulosilytica среди бактерий того же порядка (order) - Actinomycetales.
Полный геном можно найти в EMBL (EMBL AC: CP001821), запись Xylanimonas cellulosilytica DSM 15894, complete genome.
Для работы была выбрана лейциновая тРНК, которая кодируется последовательностью генома: 12491..12567. Далее приведен кодирующий участок:
>CP001821 CP001821.1 Xylanimonas cellulosilytica DSM 15894, complete genome. ggggctatagctcaggcggttagagcgcttcgctgataacgaagaggtccgaggttcaag tcctcgtagccccacca
BLAST проводился тремя разными способами. Далее приведены результаты поисков.
a. Поиск с алгоритмом megablast;
Количество результатов с e-value <0,001: 137
b. Поиск с алгоритмом blastn с параметрами по умолчанию;
Количество результатов с e-value <0,001: 253
c. Поиск с алгоритмом blastn с длиной слова = 7, match/mismatch = 1/-1 (максимально чувствительные параметры, доступные на сайте)
Количество результатов с e-value <0,001: 257
Типы поиска были выбраны по уменьшению "чувствительности": алгоритм megablast ищет только сильно похожие последовательности, а blastn включает в выдачу и менее похожие, поэтому число находок уменьшается.
Следует отметить, что для любого варианта поиска выходит большое количество хитов. Это связано с тем, что порядок, к которому принадлежит изучаемая бактерия, содержит большое число видов.