Работа 8. Отчет.
задания 1-3. Работа в классе.
Дано: неаннотированный участок генома бактерии Ornithinibacillus scapharcae (штамм TW25).
Задача: определить, где в данном фрагменте закодированы белки, похожие на известные белки
родственной бактерии (сенной палочки).
задание №4.
В ходе работы в классе программой getorf были получены все возможные открытые рамки считывания
последовательности генома с 1 по 7000 длинной более 240 нуклеотидов (такой белок сможет свернуться).
Создан белковый банк данных сенной палочки (B. subtilis) для работы пакета BLAST+.
С помощью программы BLASTP все 9 рамок прогнали по этому банку
(blastp -query ORF.fasta -db lm -out ally.txt -outfmt 7 -evalue 0.001).
В полученном файле были подсчитано число находок для каждой рамки, например так:
grep -c AEWH01000006_1....._BACSU ally.txt
Полезную информацию занесем в таблицу:
название ORF |
начало и конец во фрагменте |
направление |
число находок |
ID ближайшего белка B. subtilis |
E-value находки |
AEWH01000006_1 |
[12 - 932] |
прямое |
2 |
HELD_BACSU |
5e-61 |
AEWH01000006_2 |
[845 - 1180] |
прямое |
1 |
HELD_BACSU |
2e-28 |
AEWH01000006_4 |
[6945 - 5839] |
обратное |
4 |
CATE_BACSU |
2e-97 |
AEWH01000006_5 |
[5725 - 5354] |
обратное |
1 |
YNER_BACSU |
6e-14 |
AEWH01000006_6 |
[4992 - 3823] |
обратное |
1 |
PKSG_BACSU |
2e-48 |
AEWH01000006_7 |
[3699 - 3046] |
обратное |
1 |
YPEP_BACSU |
1e-41 |
AEWH01000006_9 |
[2098 - 1241] |
обратное |
9 |
YDEE_BACSU |
5e-65 |
Можно заметить, что обе первые рамки выровнялись с одним и тем же белком. При этом они имеют
одно и то же направление и даже пересекаются. Вероятнее всего, это связан с тем, что белок сенной палочки
большой и имеет несколько консервативных доменов, выровненых здесь.
Задание №5. Cхема ORF, для которых нашлись сходные последовательности в B. subtilis.
На основе приведенных данных составим схему последовательности участка генома Ornithinibacillus scapharcae
с 1 по 7000 нуклеотид.
3'----------------------------------------[<= YDEE, 1241-2098]---------[<= YPEP, 3046-3699]---[<= PKSG, 3823-4992]---------[<= YNER, 5354-5725]----[<= CATE, 5839-6945]---5'
5'---[=> HELD, 12-932]----------------------------------------------------------------------------------------------------------------------------------------------------3'
[=> HELD, 845-1180]
Как было замечено выше, ORF на прямой цепи пересекаются. Возможно, это следствие произожедшей мутации.
Рамки с комплементарной цепи располагаются последовательно, больших интронов нет. Это говорит о том, что
вероятнее всего гены найдены правильно.
Задание №6. Взаимное расположение предполагаемых генов.
Легче всего сделать это, составив наглядную схему:
3'-------------------------------|~|----[<= CATE, 877507-878364]----|~|-----[<= PKSG, 1769441-1770703]--|~|----------------------------------|~|---------------------------------|~|-----------------------------------------5'
5'----[=> YDEE, 543114-543986]---|~|--------------------------------|~|---------------------------------|~|----[=> YNER, 1911419-1912000]----|~|----[=> YPEP, 2288460-2289161]---|~|-----[=> HELD, 3365768-3368158]----------3'
Легко заметить, что все гены расположены с большими разрывами, минимальное расстояние между ними составило 140716 п.о.
Это, разумеется, не тянет на консервативный участок. Также нет сходства ни в последовательности
генов в геноме, ни в расположении их на цепях ДНК.
Все это, конечно, могло явиться результатом различных,
многочисленных мутаций, которые могли вовсе не повлиять на жизнь бактерии, но тогда можно сделать вывод об
отсутствии значимой связи между этими белками.
То есть, если и можно говорить о гомологии отдельных
рамок конкретным белкам, то о фиксированной последовательности их в молекуле речь не идет, по крайней мере всех
в совокупности.
Источник данных о расположении генов: Genome
Задание №7*. Пояснения.
Как уже говорилось ранее, перекрывание генов для первых двух ORF могло быть связано с длинной гена гомолога и различием
рамки считывания (например +1 и +2).
Ген helD, действительно, большой и состоит из доменов. Разумеется, перекрывания генов в одной рамке быть не может, но
при различных рамках противоречий нет. Вместе со сделанным предположением о консервативных доменах (или просто участках белка)
эти данные подсказывают, что вероятно, в геноме недавно произошла нелетальная делеция, сдвинувшая рамку считывания.
В общем, наиболее вероятно, что геном могут теперь являться обе ORF, при этом в
обоих случаях будет получаться какой-то продукт.
О его функциональности говорить мы не можем, как, строго говоря, не можем точно сказать о существовании
продукта хотя бы в одной ORF.
На страницу 3 семестра
© Aleshin Vasily