Дано: неаннотрованный участок генома бактерии Streptococcus pneumoniae (штамм TIGR4 ctg00822)
Задача: определить, где в данном фрагменте закодированы белки, похожие на известные белки родственной бактерии (сенной палочки).
Получила фрагмент (AAGY02000008) генома S.pneumoniae из заданной записи EMBL с заданным началом, длиной 7000 нуклеотидов.
Была использована программа: seqret -sask. Для выполнения программы использовала файл из EMBL.Полный протеом Bacillus subtilis получила из Swiss-Prot программой seqret sw:*_BACSU
Команда для создания индексных файлов: makeblastdb -in protein.fasta -out pr -dbtype prot.
Извлечение из моего фрагмента генома трансляции всех открытых рамок считывания длиной не менее 240 нуклеотидов командой: getorf -minsize 240 -find 1 -table 11.
Поиск сходных последовательностей программой BLAST в протеоме B. subtilis при условии E-value<0,001 командой: blastp -query aagy222.orf -db pr -evalue 0.001 -out aagfin -outfmt 6.
Книга Excel, включающая информацию обо всех открытых рамках считывания в вашем фрагменте генома. Открытых рамок 10.
Таблица предполагаемых генов (т.е., открытых рамок, для которых нашелся сходный белок в B. subtilis):
Рамка | начало во фрагменте | конец во фрагменте | направление | число гомологов | ID белка | E-value |
>AAGY02000008_5 | 5315 | 4611 | обратное | 1 | ISPD_BACSU | 1e-19 |
>AAGY02000008_6 | 4621 | 3584 | обратное | 1 | YJMD_BACSU | 8e-04 |
>AAGY02000008_7 | 3567 | 2698 | обратное | 1 | YTMP_BACSU | 2e-05 |
>AAGY02000008_8 | 2753 | 1830 | обратное | 1 | YETK_BACSU | 8e-04 |
>AAGY02000008_9 | 1830 | 1129 | обратное | 5 | GTAB_BACSU | 2e-11 |
>AAGY02000008_10 | 1042 | 185 | обратное | 1 | SMF_BACSU | 2e-47 |
Гипотетические гены во фрагменте 1–7000 записи AAGY02000008
3'--[<= SMF_BACSU, 185-1042]--[<= GTAD_BACSU, 1129-1830]--[<= YETK_BACSU, 1830-2753]--[<= YTMP_BACSU 2698-3567]--[<= YJMD_BACSU 3584-4621]--[<= ISPD_BACSU 5315-4611]---5'
5'----------------------------------------------------------------------------------------------------------------------------------------------------------------------3'
Название белка | Начало гена | Конец гена | Направление |
ISPD_BACSU | 109789 | 110484 | прямое |
YJMD_BACSU | 1304442 | 1305458 | прямое |
YTMP_BACSU | 3061288 | 3060677 | обратное |
YETK_BACSU | 788636 | 789625 | прямое |
GTAB_BACSU | 3665629 | 3666504 | прямое | SMF_BACSU | 1682580 | 1683470 | прямое |
Найденные гены Bacillus subtilis расположены далеко друг от друга и не в той последовательности, что гены Streptococcus pneumoniae. Среди них большинство генов, идущих в прямом направлении,а в участке генома Streptococcus pneumoniae таких нет. Все вышесказанное говорит о неконсервативности расположения данных генов.