Самостоятельная работа по аннотированию участка генома

Дано: неаннотрованный участок генома бактерии Streptococcus pneumoniae (штамм TIGR4 ctg00822).
Задача: определить, где в данном фрагменте закодированы белки, похожие на известные белки родственной бактерии (сенной палочки).

Фрагмент генома S.pneumoniae из заданной записи EMBL с заданным началом, длиной 7000 нуклеотидов
Полный протеом B. subtilis получен из Swiss-Prot командой seqret sw:*_BACSU
Команда для создания индексных файлов: makeblastdb -in bs_proteome.fasta -dbtype prot -out bbs
Извлечение открытых рамок: getorf -sequence fragment.fasta -outseq orf.orf -minsize 240 -find 1 -table 11
Поиск сходных последовательностей программой BLAST в протеоме B. subtilis при условии E-value<0,001: blastp -query orf.orf -db bbs -out bblala -evalue 0.001 -outfmt 6
Файл EXCEL содержит информацию обо всех открытых рамках считывания в данном фрагменте генома
4)Информация только для тех открытых рамок, для которых нашлась хотя бы одна сходная последовательность:
Рамка начало во фрагменте конец во фрагменте направление число сходных последовательностей идентификатор белкa E-value
AAGY02000001.1_10 6999 6313 обратное 5 YUGS_BACSU 4e-33
AAGY02000001.1_12 5665 2018 обратное 1 RPOB_BACSU 0.0
AAGY02000001.1_13 2018 3 обратное 1 RPOC_BACS 0.0


Схематическое положение открытых рамок, для которых нашлись сходные последовательности в B. subtilis.
3'---[<=RPOC,3-2018][<= RPOB,2018-5665]----------[<= YUGS,6313-6999]-----5'

5'-----------------------------------------------------------------------3'
Все предполагаемые гены данного фрагмента расположены на одной из комплементарных цепей.Перекрывание генов белков RPOB RPOC происходит на 1 нуклеотид. на 1 нуклеотид
6)
Индентификатор белка начало конец
YUGS_BACSU 3216163 3217452
RPOB_BACSU 121919 125500
RPOC_BACSU 125562 129161
Гомологичные им гены в геноме B. subtilis также расположены на одной из коплементарных цепей, за исключением гена белка YUGS_BACSU
Взаимное расположение гомологичных генов в геноме B. subtilis,схема:
3'---[<=RPOB,121919-125500]--[<= RPOC,125562-129161]-------------------------------5'
5'-----------------------------------------------------[=> YUGS, 3216163-3217452]--3'
При сравнении 2 схем видно, что гены белков RPOB RPOC "поменялись" местами, перекрывания не происходит совсем,даже имеется небольший участок в 61 нуклеотид между генами. Можно сказать, что расположение генов белков RPOB RPOC является консервативными, расстояние между генами очень маленькое, возможно, они входят в состав 1 оперона и выполняют сходные или взаимно зависимые функции.

На страницу 3 семестра
На главную страницу
© Акулич Ксения,2010