1.Создание индексных файлов для работы с
локальными версиями программ семейства BLAST.
vc_genome.fasta, включающий последовательности из EMBL, составляющие полный геном Vibrio cholerae pa_genome.fasta - полный геном Pseudomonas aeruginosa pm_genome.fasta - полный геном бактерии Pasteurella multocida. Создал индексные файлы, используя команды программой
formatdb: formatdb -i vc_genome.fasta
-p F -n vc 2.Поиск в неаннотированном геноме генов,
кодирующих белки, похожие на заданный.
Использовались команды:
3.Аналогичный поиск сразу в нескольких
геномах.
Создал в своей директории индексные файлы BLAST для поиска по всем трем геномам сразу. С помощью программы TBLASTN провёл поиск по трем геномам. Использовал команды: genpath=/home/export/samba/public/tmp 4.Поиск гомологов с помощью программы
BLASTN.
Скопировал fasta-файл с гeном своего белка. Поискал гомологи этого гена в трёх геномах программой BLASTN. Использовались команды: E-value лучшей находки Vibrio cholerae – 2e-26. Ниже приводится выравнивание: >embl|AE004403|AE004403 Vibrio
cholerae O1 biovar eltor str. N16961 chromosome II, section 60 of 93 of the
complete chromosome. Length = 13164 Score = 119 bits (60), Expect = 2e-26 Identities = 93/104 (89%) Strand = Plus / Minus
Query: 506 tgctgtttggtacggttgatacgtggcttatctggaaaatgactcagggccgtgtccatg
565
|||||||||||||||||||||| ||||| |
||||||||||| || |||||||| |||| Sbjct:
4898 tgctgtttggtacggttgatacatggctagtgtggaaaatgacacaaggccgtgtgcatg
4839 Query: 566 tgaccgattacaccaacgcctctcgtaccatgttgttcaacatc
609 |||||||||||||||||||
|| ||||| ||| ||||||||||| Sbjct:
4838 tgaccgattacaccaacgcatcccgtactatgctgttcaacatc
4795 Запись EMBL AE004403, геном Vibrio cholerae O1 biovar eltor str. N16961 chromosome II, section 60 of 93 of the
complete chromosome. Находка полностью идентична лучшей находке при поиске по геному Vibrio cholerae (в
первом задании). |
На главную страницу третьего
семестра
© Кузеванов Алексей,2005