Cамостоятельная работа




Занятие 8. Cамостоятельная работа

Самостоятельная работа по аннотированию участка генома

Дано: неаннотрованный участок генома бактерии Streptococcus pneumoniae (штамм TIGR4 ctg00822).
Задача: определить, где в данном фрагменте закодированы белки, похожие на известные белки родственной бактерии (сенной палочки).
Фрагмент генома S.pneumoniae из заданной записи EMBL с заданным началом, длиной 7000 нуклеотидов
Полный протеом B. subtilis получен из Swiss-Prot командой: seqret sw:*_BACSU
Команда для создания индексных файлов: makeblastdb -in bs_genome.fasta -dbtype prot -out bbs
Извлечение открытых рамок: getorf -sequence aa.fasta -outseq aa.orf -minsize 240 -find 1 -table 11
Поиск сходных последовательностей программой BLAST в протеоме B. subtilis при условии E-value<0,001:
blastp -query aa.orf -db bbs -out bblala -evalue 0.001 -outfmt 6
Файл EXCEL содержит информацию обо всех открытых рамках считывания в данном фрагменте генома

Информация только для тех открытых рамок, для которых нашлась хотя бы одна сходная последовательность

Pамка Начало Конец Напрaвление Число сходных последовательностей Идентификатор белка Е-value
AAGY02000001_3 6993 6718 обратное 1 YETJ_BACSU 1e-05
AAGY02000001_5 5558 5010 обратное 1 YLBH_BACSU 1e-40
AAGY02000001_6 4841 4533 обратное 1 COAD_BACSU 5e-11
AAGY02000001_7 4546 3512 обратное 2 YLBL_BACSU 4e-55
AAGY02000001_9 3230 1917 обратное 2 MURA1_BACSU 1e-137
AAGY02000001_11 668 3 обратное 5 YRKA_BACSU 8e-18

Схема положения открытых рамок, для которых нашлись сходные последовательности в B. subtilis.

3'-[<= YRKA, 3-668]----------------[<= MURA1, 1917-3230]---[<= YLBL, 3512-4546][<= COAD, 4533-4841]----[<= YLBH, 5010-5558]------------------[<= YETJ, 6718-6993]--5'

5'--------------------------------------------------------------------------------------------------------------------------------------------------------------------3'

Все предполагаемые гены данного фрагмента расположены на одной из комплементарных цепей. Перекрывание происходит генов белков YLBL и COAD на 14 нуклеотидов

Индентификатор белка Начало Конец
YETJ_BACSU 787992 788636
YLBH_BACSU 1569199 1569319
COAD_BACSU 1570078 1570563
YLBL_BACSU 1572765 1573790
MURA1_BACSU complement 3777949 complement 3779259
YRKA_BACSU complement 2718959 complement 2720263

Cхема взаимного расположения гомологичных генов в геноме B. subtilis:

3'---[<=YETJ, 787992-788636]---[<=YLBH, 1569199-1569319]-[<=COAD, 1570078-1570563]-[<=YLBL, 1572765-1573790]-----------------------------------------------------------5'
5'-------------------------------------------------------------------------------------------------------------[=>YRKA, 2718959-2720263]---[=>MURA1, 3777949-3779259]--3'

При сравнении двух схем видно, что гомологичные им гены в геноме B. subtilis также расположены на одной из коплементарных цепей, за исключением генoв белков MURA1_BACSU и YRKA_BACSU, а гены белков YRKA и MURA1 поменялись местами, все остальные гены находятся в том же порядке, но в обратном направлении; перекрывания вовсе не происходит, и наоборот, имеются участки порядка двух тысяч нуклеотидов и меньше между генами YLBH, COAD, YLBL, поэтому их расположение можно назвать консервативным в виду не очень большого расстояния между генами, и возможно они входят в состав одного оперона и выполняют сходные или взаимно зависимые функции. Про остальные гены белков такого не скажешь, так как расстояние между ними достигает миллиона нуклеотидов, поэтому они принадлежат совершенно разным оперонам с отдельными специфическими функциями.



©Андреянова Екатерина