Отчеты по BLAST

Задания 3.2 и 3.3. Поиск в геномах участков, кодирующих белки, похожие на TRXB_ECOLI

Чтобы определить, есть ли в геноме бактерии Pasteurella multocida гены, похожие на тиоредоксин редуктазу кишечной палочки E. coli K-12, я провела поиск с помощью программы TBLASTN с порогом E-value 0,001.

Поиск гомологов TRXB_ECOLI Геном Pasteurella multocida
Число находок с Е-value<0,001 2
Новое число находок с Е-value<0,001 при поиске сразу в 3-х геномах* 12
Характеристика лучшей находки:
1 E-value находки e-135
2 AC соответствующей записи EMBL AE006093
3 координаты выравнивания в записи EMBL 86-1027 (complement)
4 Координаты CDS в записи EMBL (если они есть) complement (74-1027)
5 AC UniProt в записи EMBL (если есть) Q9CN66
6 Новый E-value той находки при поиске сразу в 3-х геномах e-134 (эта находка оказалась 2-й по счету)
*- Геномы Pasteurella multocida, Salmonella typhimurium и Xanthomonas campestris.
При поиске генов, кодирующих возможные гомологи тиоредоксин редуктазы Trxb_ecoli, в геноме P.mutolcida, лучшая находка имеет E-value e-135, поэтому можно говорить о значительном сходстве белков. При поиске гена, кодирующего этот гомолог, оказалось, что он, так же как и Trxb_ecoli, является тиоредоксин редуктазой. При поиске в трех геномах (т.е.при увеличении БД примерно в 5 раз) значение E-value 1-й находки увеличилось незначительно - до e-135 - из-за значительного сходства белков.
Гены, кодирующие тиоредоксин редуктазы (с различной степенью сходства с тиоредоксин редуказой E.coli - E-value - e-171 и e-115 соответственно) - во всех четырех геномах они называются одинаково - trxB - были обнаружены также в геномах S.typhimurium и X.campestris.

Задание 3.4. Поиск гомологов с помощью программы BLASTN

При поиске с помощью BLASTN лучшая находка в прошлом случае из генома S.typhimurium, которая имела очень малый, но не ненулевой E-value, на этот раз имеет E-value равный нулю. Двум другим находкам (последовательность та же, что и в предыдущем поиске, но E-value находкам присвоены намного большие: 1e-08 и 1e-05). И всего найдено 3 находки - три тиоредоксин редуктазы, похожие на тиоредоксин редуктазу у кишечной палочки (согласно также аннотации генов). Объяснение этому может быть такое: BLАSTN ищет наиболее близкую нуклеотидную последовательность, а TBLASTN ищет последовательность белка - продукта искомого гена, и в силу вырожденности генетического кода одинаковые белки могут иметь различные соответствующие нуклеотидные последовательности, поэтому BLАSTN может присваивать большие E-value находкам, чем ТBLАSTN. Это вроде бы объясняет большее E-value 2-й и 3-й находок при поиске в BLASTN. А такое изменение E-value 1-й находки можно объяснить наличием в последовательности запроса участка, состоящего из Х, при выравнивании с помощью TBLASTN, чего не было при поиске с помощью BLASTN.

Задание 4.1. Определите, какая тРНК была использована рибосомой при присоединении 4-ого аминокислотного остатка к растущей цепи вашего белка

4-й а. о. в моем белке – это треонин (Т = Thr). Ему соответствует в гене тиоредоксин редуктазы кодон ACA, и «идеальный» антикодон – это UGU (подчеркнуты «качающиеся» позиции).

 Аминокислотный остаток в 4-ой позиции белка TRXB_ECOLI T=Thr
 Соответствующий кодон в гене trxB 5'-ACС-3'
 Идеальный антикодон 5'-GGU-3'
 Сколько можно было бы ожидать разных тРНК для остатка Thr
(если опираться на генетический код)?
4
 Сколько тРНК для остатка Thr аннотировано в геноме кишечной палочки? 4
 Характеристика выбранной для дальнейшего изучения тРНК:
1название гена thrV
2координаты гена в записи EMBL 3421642-3421677
3антикодон UGU
4кодон ACY

Команды:

Команда для вытаскивания: seqret ecoli.embl -sask + ответы на вопрос с помощью данных из таблицы или seqret ecoli.embl -sbegin 3421642 -send 3421677.
Команда для подсчета: grep “anticodon.*threonine” -wc или grep “anticodon.*threonine” | wc –l.
Команда для поиска: grep 'anticodon.*threonine' ecoli.embl > anti.list.

Результаты поиска:


Описание данной треониновой тРНК:


Последовательность гена thrV в формате fasta:

Задание 4.2. Поиск гомологичных треониновой тРНК E.coli в геноме архебактерии Sulfolobus solfataricus P2

Программа FastA BLASTN MegaBLAST Discontigous
MegaBLAST
Число находок с Е-value < 0,001 --- --- --- ---
Характеристика лучшей находки:
1 E-value находки 0.15 0.86 0.22 ---
2 Номер сектора генома 5 110 5 ---
3 AC соответствующей записи EMBL AE006646
(AE006641)
AE006641
(AE006751)
AE006646
(AE006641)
---
4 координаты выравнивания в записи EMBL 7723-7744 6875-6887 7725-7742 ---
5 Аннотация лучшей находки по EMBL tRNA-Asn --- tRNA-Asn ---

Команды:
1. fasta35 thru.fasta /home/export/samba/public/tmp/ss_genome.fasta
За счет малой длины якоря самый низкий Е-value, но несмотря на это, гомологов для этой тРНК программа не нашла. Лучшая находка в выдача почти совпадает (в т.ч. по координатам находки в геноме) с megablast, только E-value немного меньше.
2. blastall -d ss -p blastn -i thru.fasta -o blastn.list
E-value лучшей находки очень велик, т.к. в геноме S.solfataricus есть гены, только отдаленно похожие на ген этой тРНК, а программа не рассчитана на поиск отдаленных гомологов. Причем эта находка не является геном.
3. megablast -d ss -i thru.fasta -o megablast.list -W 4 -D 2
Нашел тРНК, но намного более длинную и не треониновую, а аспарагиновую.
4. megablast -d ss -i thrv.fasta -o dmegablast.list -D 2 -W 11 -t 16 -N 2
Ничего не нашел вообще.

При использовании ключа -e со значением 0.001 программы Blast ничего не находили. Поэтому можно заключить, что последовательность данной треониновой тРНК специфична для данного рода.



Главная страница > Третий семестр > Отчеты по BLAST


© Александра Далина