Cамостоятельная работа
Занятие 8. Cамостоятельная работа
Самостоятельная работа по аннотированию участка генома
Дано: неаннотрованный участок генома бактерии Streptococcus pneumoniae (штамм TIGR4 ctg00822).
Задача: определить, где в данном фрагменте закодированы белки, похожие на известные белки родственной бактерии (сенной палочки).
Фрагмент генома S.pneumoniae из заданной записи EMBL с заданным началом, длиной 7000 нуклеотидов
Полный протеом B. subtilis получен из Swiss-Prot командой: seqret sw:*_BACSU
Команда для создания индексных файлов: makeblastdb -in bs_genome.fasta -dbtype prot -out bbs
Извлечение открытых рамок: getorf -sequence aa.fasta -outseq aa.orf -minsize 240 -find 1 -table 11
Поиск сходных последовательностей программой BLAST в протеоме B. subtilis при условии E-value<0,001:
blastp -query aa.orf -db bbs -out bblala -evalue 0.001 -outfmt 6
Файл EXCEL содержит информацию обо всех открытых рамках считывания в данном фрагменте генома
Информация только для тех открытых рамок, для которых нашлась хотя бы одна сходная последовательность
Pамка
|
Начало
|
Конец
|
Напрaвление
|
Число сходных последовательностей
|
Идентификатор белка
|
Е-value
|
AAGY02000001_3 |
6993
|
6718
|
обратное
|
1
|
YETJ_BACSU
|
1e-05
|
AAGY02000001_5 |
5558
|
5010
|
обратное
|
1
|
YLBH_BACSU
|
1e-40
|
AAGY02000001_6 |
4841
|
4533
|
обратное
|
1
|
COAD_BACSU
|
5e-11
|
AAGY02000001_7 |
4546
|
3512
|
обратное
|
2
|
YLBL_BACSU
|
4e-55
|
AAGY02000001_9 |
3230
|
1917
|
обратное
|
2
|
MURA1_BACSU
|
1e-137
|
AAGY02000001_11 |
668
|
3
|
обратное
|
5
|
YRKA_BACSU
|
8e-18
|
Схема положения открытых рамок, для которых нашлись сходные последовательности в B. subtilis.
3'-[<= YRKA, 3-668]----------------[<= MURA1, 1917-3230]---[<= YLBL, 3512-4546][<= COAD, 4533-4841]----[<= YLBH, 5010-5558]------------------[<= YETJ, 6718-6993]--5'
5'--------------------------------------------------------------------------------------------------------------------------------------------------------------------3'
Все предполагаемые гены данного фрагмента расположены на одной из комплементарных цепей. Перекрывание происходит генов белков YLBL и COAD на 14 нуклеотидов
Индентификатор белка
|
Начало
|
Конец
|
YETJ_BACSU |
787992
|
788636
|
YLBH_BACSU |
1569199
|
1569319
|
COAD_BACSU |
1570078
|
1570563
|
YLBL_BACSU |
1572765
|
1573790
|
MURA1_BACSU |
complement 3777949
|
complement 3779259
|
YRKA_BACSU |
complement 2718959
|
complement 2720263
|
Cхема взаимного расположения гомологичных генов в геноме B. subtilis:
3'---[<=YETJ, 787992-788636]---[<=YLBH, 1569199-1569319]-[<=COAD, 1570078-1570563]-[<=YLBL, 1572765-1573790]-----------------------------------------------------------5'
5'-------------------------------------------------------------------------------------------------------------[=>YRKA, 2718959-2720263]---[=>MURA1, 3777949-3779259]--3'
При сравнении двух схем видно, что гомологичные им гены в геноме B. subtilis также расположены на одной из коплементарных цепей,
за исключением генoв белков MURA1_BACSU и YRKA_BACSU, а гены белков YRKA и MURA1 поменялись местами, все остальные гены находятся
в том же порядке, но в обратном направлении; перекрывания вовсе не происходит, и наоборот, имеются участки порядка двух тысяч
нуклеотидов и меньше между генами YLBH, COAD, YLBL, поэтому их расположение можно назвать консервативным в виду не очень большого
расстояния между генами, и возможно они входят в состав одного оперона и выполняют сходные или взаимно зависимые функции.
Про остальные гены белков такого не скажешь, так как расстояние между ними достигает миллиона нуклеотидов, поэтому
они принадлежат совершенно разным оперонам с отдельными специфическими функциями.
©Андреянова Екатерина