НА ГЛАВНУЮ

Поиск гомологов белка PDXH_ECOLI
в геномах родственных бактерий

Поиск в геноме Vibrio cholerae

С помощью программы tblastn был проведён
поиск гомологов белка в геноме холерного вибриона
и найден ближайший гомолог:

  • Acession number соответствующей записи EMBL: AE004433
  • координаты выравнивания в записи: 6256-5630
  • соответствующий CDS аннотирован, его координаты: 5627-6262 на обратной цепи
  • AC соответствующего белка в UniProt: Q9KKM4
  • E-value находки: 1e-82
  • других гомологов с E-value меньше 0,01 не найдено.

Поиск по трём геномам

Далее был проведён поиск среди трёх геномов:
холерного вибриона (Vibrio cholerae), синегнойной палочки
(Pseudomonas aeruginosa) и пастереллы мультоцида (Pasteurella multocida).

Получено четыре находки с E-value меньше 0,01:

                                                                Score(bits) E Value 
embl|AE004433|AE004433 Vibrio cholerae O1 biovar eltor str. N169... 299 4e-82 embl|AE004537|AE004537 Pseudomonas aeruginosa PAO1, section 98 o... 182 6e-47 embl|AE004838|AE004838 Pseudomonas aeruginosa PAO1, section 399 ... 113 5e-26 embl|AE004616|AE004616 Pseudomonas aeruginosa PAO1, section 177 ... 113 5e-26

E-value прежней находки возросло (её надёжность упала)
в связи с увеличением базы поиска.

Поиск гена

Теперь ищем ген, кодирующий мой белок, в этих же трёх геномах.
Использую программу blastn .
Был найден только один гомолог с E-value меньше 0,01:
                                                                Score(bits) E Value 
embl|AE004433|AE004433 Vibrio cholerae O1 biovar eltor str. N169... 50 7e-06
причём E-value значительно больше, чем в tblastn ,
а остальных трёх гомологов вообще нет в выдаче.

Поиск программой Fasta34

Программой Fasta34 ищем гомологов гена в геноме холерного
вибриона (так как в нём был лучший гомолог по результатам Blast).
Найден тот же гомолог, только границы выравнивания изменились.
  • Координаты выравнивания: 657-35 (для моего гена), 5627-6249 (в геноме V. cholerae)
  • E-value находки: 2.8e-59

Megablast

Был взят фрагмент генома Vibrio cholerae длиной 110 нуклеотидов.
Посредством Megablast (параметры по умолчанию) среди трёх геномов
нашлось три гомолога этого фрагмента, и все три — в холерном вибрионе.
                                                                 Score    E
                                                                 (bits) Value

embl|AE004319|AE004319 Vibrio cholerae O1 biovar eltor str. N169...   218   2e-57
embl|AE004126|AE004126 Vibrio cholerae O1 biovar eltor str. N169...   218   2e-57
embl|AE004119|AE004119 Vibrio cholerae O1 biovar eltor str. N169...   218   2e-57 
(blastn при параметрах по умолчанию находит 12 гомологов в трёх
организмах, и 6 из них имеют совпадающие участки не менее 28 нуклеотидов).

Megablast ищет участки точного совпадения 28 нуклеотидов
(если не задать друое число). Поэтому после замены каждой двадцать восьмой
буквы (всего 3 буквы в последовательности) Megablast этих гомологов
найти уже не может.

Фрагмент и изменённый фрагмент (заменённые буквы обозначены красным):

>AE004119   attcggtttagatttgagcatcaagtgggtctgtagctcaggtggttagagcgtacgcct
>изменённый attcggtttagatttgagcatcaagtgTgtctgtagctcaggtggttagagcgtaAcct

>AE004119   gataagcgtaaggtcggtggttcgagtccactcagacccaccactaacga
>изменённый gataagcgtaaggtcggtggttcgCtccactcagacccaccactaacga 

Поиск гомологов глициновых тРНК E.coli

Искали гомологи для трёх последовательностей ТРНК.
Поиск вёлся с помощью discontigous Megablast по трём геномам.
Команда для поиска:
 megablast -t 16 -W 11 -N 0 -D 2 -d all -i tRNAs_G.txt -o tRNAs_G.megablast 

Найдено гомологов с E Value < 0,01:

  Pseudomonas aeruginosa Pasteurella multocida Vibrio cholerae
tRNA: anticodon: GCC 6 4 4
tRNA: anticodon: CCC 2 0 0
tRNA: anticodon: TCC 1 1 2