На главную страницу третьего семестра Гомологи белка TRUB_ECOLI

Поиск с помощью программы BLASTALL гомологов белка TRUB_ECOLI

Поиск с помощью программы TBLASTN ближайшего гомолога белка TRUB_ECOLI в геноме синегнойной палочки (Pseudomonas aeruginosa)

AC записи EMBL ближайшего гомолога TRUB_ECOLI — AE004888.

Координаты выравнивания: 3725-2820. Из того, что координаты выравнивания в записи начинаются с большего числа (3725), а заканчиваются меньшим (2820), можно сделать вывод, что программа TBLASTN протранслировала последовательность комплементарную цепи ДНК, данной ей (программе) на входе (stdin).

E-value ближайшего гомолога белка TRUB_ECOLI — 8e-78. BLAST не предлагает других гомологов белка TRUB_ECOLI с E-value < 0,01. Соответствующий CDS в записи EMBL аннотирован, так как его координаты примерно совпадают с координатами выравнивания и часть гомологичной последовательности в выравнивании совпадает с белком, приведенным в записи EMBL

Координаты CDS в записи EMBL — (2811..3725).

AC ближайшего гомолога белка TRUB_ECOLI в UniProt — P72154.

Материалы и методы:
Поиск производился с помощью программы blastall со следующими параметрами: -p (использовалось значение tblastn), -e со значением 0.01 для поиска гомологов с E-value < 0,01. Blastall для работы использовал индексные файлы, созданные программой formatdb для поиска гомологов по геному Pseudomonas aeruginosa.

Поиск с помощью программы TBLASTN ближайшего гомолога белка TRUB_ECOLI по 3 геномам: Vibrio cholerae, Pseudomonas aeruginosa, Pasteurella multocida.

E-value находки из предыдущего пункта увеличился: 2e-77 против 8e-78. С E-value меньше < 0,01 нашлось 3 белка, причем из разных организмов. Ближайший гомолог из организма Vibrio cholerae.

Материалы и методы:
С помощью программы formatdb были созданы индексные файлы BLAST для поиска по всем трем геномам сразу, а затем с помощью blastall с параметром-p tblastn был произведен поиск гомологов.

Поиск с помощью программы BLASTN гомологов гена, кодирующего белок TRUB_ECOLI по 3 геномам: Vibrio cholerae, Pseudomonas aeruginosa, Pasteurella multocida.

Было найдено 2 гомолога гена, кодирующего белок TRUB_ECOLI, с E-value < 0,01. Ближайший гомолог гена, кодирующего белок TRUB_ECOLI, из Vibrio cholerae.

Материалы и методы:
Использовались индексные файлы BLAST, созданные программой formatdb, для поиска по всем трем геномам сразу. Гомологи гена, кодирующего белок TRUB_ECOLI, были найдены blastall с параметрами -p blastn, -e 0.01.

Программы поиска Fasta и Megablast

Поиск гомологов гена белка TRUB_ECOLI программой fasta34 в геноме Vibrio cholerae.

По результатам TBLASTN в геноме Vibrio cholerae имеется лучший гомолог белка TRUB_ECOLI.

E-value лучшей находки — 1.6e-81

Лучшая находка — тот же самый ген, что нашелся с помощью TBLASTN.

Границы выравнивания — 6112-7032

AC записи EMBL — AE004150

Работа с программой Megablast

Для работы была взята часть гена (1-100) ближайшего гомолога гена, кодирующего белок TRUB_ECOLI, длиной в 100 н. о. Megablast находит этот фрагмент в BLAST-банке из трех геномов: Vibrio cholerae, Pseudomonas aeruginosa и Pasteurella multocida. Данный фрагмент мне потребовалось изменить в 3-ех местах, чтобы при задании измененной последовательности в качестве пробы Megablast (при параметрах по умолчанию) уже не находил в геномах исходной последовательности.

Исходный фрагмент Измененный фрагмент
caaatcgtaaagtgattttttttagaaAatacctcttgtcagtctcggaa ccattCgttagtattgcgtccgctttcggagag Aaaggtcgctggccttg caaatcgtaaagtgattttttttagaaTatacctcttgtcagtctcggaa ccattGgttagtattgcgtccgctttcggagag Caaggtcgctggccttg

Комментарии:
Измененные основания выделены цветом. Я поменяла буквы в следующих положениях: 28, 56 и 84. Я изменила буквы именно в этих положениях, потому что по умолчанию минимальная длина сходства должна равняться 28. А при этих заменах в измененной последовательности нет фрагментов длиной больше либо равно 28, на 100% совпадающих с исходной последовательностью.

Материалы и методы:
Часть гена гомолога белка TRUB_ECOLI была взята с помощью программы seqret с опцией -sask. Для поиска этой части гена в BLAST-банке из трех геномов использовался Megablast со следующими параметрами: -d (базовое имя индексных файлов), -D (использовалось значение 2, означающее "traditional BLAST output").

На главную страницу третьего семестра


© Армаш Татьяна,2005