Занятие 3. Программы пакета BLAST для работы с нуклеотидными последовательностями

· Создание индексных файлов для программ пакета BLAST


Для создания индексных файлов для генома Xanthomonas campestris, в командной строке linux нужно ввести следующую команду:
formatdb -i xc_genome.fasta -p F -n xc
 
Файлы с “3g” относятся к поиску по 3-м геномам.
 
 

Поиск в геноме участков, кодирующих белки, похожие на заданный


Поиск гомологов SYY_ECOLI

Геном бактерии Xanthomonas campestris

Число находок с Е-value<0,001

1

Характеристика лучшей находки:



E-value находки

3e-24


AC соответствующей записи EMBL

AE012505 AE008922 AE012505


координаты выравнивания(-ий) в записи EMBL

3885..2824


Координаты CDS в записи EMBL (если они есть)

2737..3948


AC UniProt в записи EMBL (если есть)

Q8P475 Q8PAD0


E-value находки в поиске по 3-м геномам

7e-24


Число находок с Е-value<0,001 в поиске по 3-м геномам

3
 
Катализирует присоединение тирозина к tRNA в реации, которая происходит в 2 шага-сначала тирозин
 
активируется с помощью ATP и переходит в форму Tyr-AMP затем он переносится на акцепторный конец tRNA. Вывод-мы нашли гомологичный белок.
У лучшей находки выравнивание наблюдается практически у всего фрагмента, а не у небольшого куска.
При поиске по 3-м геномам выросло e-value нашей находки, так как чем больше размер вводных данных, тем сильнее увеличивается возможность случайного совпадения. 

Поиск гомологов с помощью программы BLASTN


e-value лучшей находки 0.0(из Salmonella typhimurium)
AC- AE008763(тот же, что и при поиске по 3-м геномам у лучшей находки(файл 3g_search.txt))
В последнем задании программа строит выравнивание по ДНКовым последовательностям.
При поиске с помощью blastn e-value оказалось равно 5.1.
E-value сильно отличается от e-value при поиске в геномах, следовательно мы нашли удаленный гомолог.
BLASTN не может найти удаленные гомологи с высокой точностью, так как создан для поиска близкородственных.
Описание соответствующего cds в EMBL:


similar to E. coli tyrosine tRNA synthetase