![]() |
||||
|
Поиск в геноме участков, кодирующих белки, похожие на заданный
Поиск белка P0ABD8 (последовательность которого была получена при помощи программы seqret из базы данных SwissProt: посмотреть последовательность) осуществлялся в геноме бактерии Pasteurella multocida при помощи программы blastall с параметрами: blastall -p tblastn -d pm -i bccp_ecoli.fasta -o tblastn_bccpОпция -p tblastn: поиск осуществляется по известной белковой последовательности среди нуклеотидных последовательностей Опция -d pm: программой используются индексные файлы, созданные ранее, с базовым именем pm Опция -i bccp_ecoli.fasta: последовательность белка, подаваемая на вход программе Опция -o tblastn_bccp: результат работы программы, посмотреть Поиск гомологов белка P0ABD8 в геноме бактерии Pasteurella multocida
Нахождение записи EMBL по последовательности с помощью программы BLASTN На сайте EBI в банке "EMBL standart prokaryote" был проведен поиск AC записи гена гомолога белка P0ABD8 (найденного в предыдущем задании) в нынешнем релизе EMBL. В результате: AC: AE004439 Координаты из аннотации: 1298798-1299043 Отрывок записи EMBL, соответствующий данным координатам: FT CDS complement(1297617..1299035) FT /codon_start=1 FT /transl_table=11 FT /gene="aspA" FT /locus_tag="PM1103" FT /product="AspA" FT /db_xref="GOA:Q9CLV0" FT /db_xref="HSSP:1JSW" FT /db_xref="InterPro:IPR018951" FT /db_xref="UniProtKB/TrEMBL:Q9CLV0" FT /protein_id="AAK03187.1" FT /translation="MTVTRKEVDLLGEREVPADAYWGIHTLRAVENFNISNAVISDVPD FT FVRGMVMVKKATALANGELGAIPDKIAKAIVAACDEILTTGKCLDQFPSDIYQGGAGTS FT VNMNTNEVVANLALELLGHKKGEYQYLDPMDHVNASQSTNDAYPTGFRIAVYNSIMKLV FT AKVLYLQQGFENKAKEFSHILKMGRTQLQDAVPMTVGQEFKAFSVLLDEEVRNLTRTAE FT YLLEVNLGATAIGTGLNTPKGYAPLAVKYLSEVTGLPCVLAENLIEATSDCGAYVMVHG FT ALKRTAVKLSKVCNDLRLLSSGPRAGLNEINLPELQAGSSIMPAKVNPVVPEVVNQVCY FT KVMGNDTTITFAAEAGQLQLNVMEPVIAQAMFESIDILTNACVNLRDKCIDGITVNKET FT CENYVFNSIGIVTYLNPFIGHHNGDLVGKICAKTGRGVKEVVLEKGLLTEAELDDILSV FT ENLMNPTYKAKLNK"Этот участок является частью CDS (1297617-1299035), он соответствует записи Q9CLV0 SwissProt. Как видно, правая координата выходит за границы CDS на 8 нуклеотидов. Имя кодируемого данной CDS гена - aspA, последовательность лежит на комплементарной цепи. Поиск гомологов с помощью программы BLASTN При помощи опции BLASTN программы blastall был осуществлен поиск нуклеотидной последовательности белка P0ABD8 по нуклеотидной последовательности генома бактерии Pasteurella multocida (подобно первому заданию). Полученный на выходе программы файл: посмотреть. По результатам программы была заполнена таблица:
По сравнению с tblastn, при помощи blastn было найдено гораздо больше последовательностей, однако действительно гомологом из них можно назвать только одну, с низким e-value, которое, тем не менее, выше, чем у e-value лучшей находки из упражнения 1. В этом случае находка из той же последовательности, что и в 1 упражнении, однако координаты выравнивания другие. Отчет по заданию BLAST(продолжение) Отчет по выполнению задания |