|
Блок 2: Самостоятельная работа
Дано: неаннотрованный участок генома бактерии Streptococcus pneumoniae (штамм TIGR4 ctg00822).
Задача: определить, где в данном фрагменте закодированы белки, похожие на известные белки родственной бактерии (сенной палочки).
Определение инструментов для решения поставленной задачи:
Получение полного протеома B. subtilis из Swiss-Prot:
seqret sw:*_BACSU
output sequence(s) : bacsu.fasta
Создание индексных файлов для поиска программами пакета BLAST
makeblastdb -in bacsu.fasta -dbtype prot -out bacsu
Извлечение из данного фрагмента генома трансляции всех открытых рамок считывания длиной не менее 240 нуклеотидов
(открытой рамкой считается последовательность,
начинающаяся со старт-кодона и заканчивающаяся стоп-кодоном):
getorf -find 1 -minsize 240 -sequence AAGY02000002.fasta -outseq AAGY02000002.orf -table 11
Программой getorf были получены трансляции всех открытых рамок считывания данного фрагмента длиной не менее 240 нуклеотидов:
getorf -minsize 240 -find 1 -table 11 ...
Подсчет для каждой открытой рамки считывания числа сходных последовательностей, полученных программой blastp :
Скрипт тут
Рамка считывания |
Начало-конец во фрагменте |
Направление |
Число сходных последовательностей, найденных программой blastp в протеоме
при условии E_value меньше 0.001 |
Идентификатор самого близкого из найденных белков B. subtilis |
E-value находки |
>AAGY02000005_2 |
2546 - 3022 |
Прямое |
1 |
RLMH_BACSU |
9e-48 |
>AAGY02000005_3
|
3453 - 4775 |
Прямое |
2 |
MALK_BACSU |
1e-06 |
>AAGY02000005_4 |
4775 - 5524 |
Прямое |
2 |
LYTT_BACSU |
5e-07 |
>AAGY02000005_5 |
6482 - 7000 |
Прямое |
1 |
YHGE_BACSU |
2e-21 |
>AAGY02000005_6 |
6333 - 5773 |
Обратное |
1 |
YXBF_BACSU |
2e-04 |
>AAGY02000005_7 |
2375 - 1185 |
Обратное |
3 |
YYXA_BACSU |
3e-73 |
>AAGY02000005_8 |
1127 - 369 |
Обратное |
2 |
SP0J_BACSU |
3e-54 |
Схематическое изображение положения открытых рамок во фрагменте: Тут
В схеме B. subtilis все гены расположены очень далеко друг от друга (минимальное расстояние между RLMN и YYXA: 16080)
В схеме генома Spneumoniae наблюдается перекрывание MALK и LYTT. Возможно, функции этих генов связаны, так как происходит перекрывание их последовательностей => они одновременно транскрибируются.
|
|