Занятие 6. Программы пакета BLAST для работы с нуклеотидными последовательностями


Задание 1. Поиск в геноме бактерии Listeria monocytogenes участков, кодирующих белки, похожие на IOLA_BACSU


Создание индексных файлы пакета BLAST+ для поиска по геному. С помощью команды
makeblastdb -in lm_genome.fasta -dbtype 'nucl' -out lm
были созаны индексных файлы lm.nhr, lm.nsq, lm.nin.
Для данного поиска гомологов нвм подходит программа TBLASTN из пакета BLAST+, т.к. TBLASTN осуществляет поиск гомологов белка в неаннотированных нуклеотидных последовательностях. С помощью команды
tblastn -query IOLA_BACSU.fasta -db lm -out iola_lm.txt -evalue 0.001
был создан файл iola_lm.txt
Число находок с E-value < 0,001 3
E-value лучшей находки 0.0
Название последовательности с лучшей находкой AL591977 Listeria monocytogenes strain EGD
Координаты лучшей находки (от-до) 58787-60211
Доля последовательности вашего белка, вошедшая в выравнивание с лучшей находкой 476/487=0.9774

Задание 2. Нахождение записи EMBL по последовательности программой BLASTN


При помощи интерфейса к программе BLASTN на сайте EBI было найдено записи EMBL, в которых nприсутствует искомая последовательность. последовательность.
Опишем пятую находку с процентом совпадения равный 100% и E-value = 6.0E-95, она соответствует записи EMBL с идентификатором AB001341. Координаты заданной последовательности в записи 549-728;она соответствует направлению записи. В поле FT описан участок 129..1526, включающий данную последовательность; это участок кодирует ген mcrB его прямое направление относительно записи совподает с направлением заданной последовательности.
FT   CDS             129..1526
FT                   /codon_start=1
FT                   /transl_table=11
FT                   /gene="mcrB"
FT                   /product="NcrB"
FT                   /note="McrB protein recognizes and restricts the sequence
FT                   specific DNA molecule containing 5-methyl-cytosine
FT                   residues"
FT                   /note="essential for McrB"
FT                   /db_xref="GOA:P96754"
FT                   /db_xref="InterPro:IPR003593"
FT                   /db_xref="InterPro:IPR011704"
FT                   /db_xref="InterPro:IPR021961"
FT                   /db_xref="UniProtKB/TrEMBL:P96754"
FT                   /experiment="experimental evidence, no additional details
FT                   recorded"
FT                   /protein_id="BAA19243.1"
FT                   /translation="MRKAHLMESIQAWIEKFIEQAQQKSSQSTKDYPTSYRNLRVKVSF
FT                   GYGNFTSIPWFAFLGEGQEVSNGIYPVILYYKDFDELVLAYGISDTNKPHAQWQFSSDI
FT                   PKTIAEYFQTTSGVYPKKYGQSYYACSQKVSQGLDYTRFASMLDNIINDYKLIFNSGKS
FT                   VIPPMSKTESYCLEDALNDLFIPETTIETILKRLTIKKNIILQGPPGVGKTFVARRLAY
FT                   LLTGEKAPQRVNMVQFHQSYSYEDFIQGYRPNGVGFRRKDGIFYNFCQQAKEQPEKKYV
FT                   FIIDEINRANLSKVFGEVMMLMEHDKRGENWSVPLTYSENDEERFYVPENVYIIGLMNT
FT                   ADRSLAVVDYALRRRFSFIDIEPGFDTPQFRNFLLNKKAEPSFVESLCQKMNELNQEIS
FT                   KEATILGKGFRIGHSYFCSGLEDGTSPDTQWLKEIVMTDIAPLLEEYFFDDPYKQQIWA
FT                   DKLLGDS"

Задание 3. Поиск гомологов гена программой BLASTN


Что бы создать я взяла запись EMBL BAA21609 , на которую ссылается запись о белке IOLA_BACSU в Swiss-Prot, нашла в ней координаты соответствующей CDS и вырезать последнюю программой seqret в отдельный файл
seqret -sask
С помощью команды
blastn -query iola.fasta -db lm -out blastn_iola_lm.txt -evalue 0.001 -task blastn
был получен файл с результатом поиска гомологов.
Число находок с E-value < 0,001 1
E-value лучшей находки 0.0
Название последовательности с лучшей находкой AL591975 Listeria monocytogenes strain
Координаты лучшей находки (от-до) 46637-48079
Доля последовательности вашего белка, вошедшая в выравнивание с лучшей находкой 1443/1464=0.9857


© Julia Chudakova