Занятие 10 (зачётное)
Дано: неаннотированный фрагмент генома бактерии Yersinia mollaretii
Задача: определить, закодированы ли данном фрагменте какие-либо белки, похожие на известные белки родственной бактерии (кишечной палочки).
1) Полный протеом E. coli получим из Swiss-Prot с помощью команды
Seqret sw: *_ECOLI
получим ecoli.fasta
2) Создадим индексные файлы для поиска программами пакета BLAST
formatdb -i xc_genome.fasta -p F -n eco
3) Вырезаем нужный фрагмент генома с помощью
seqret –sask
4) Извлеките из вашего фрагмента трансляции всех открытых рамок считывания длиной не менее 240 нуклеотидов. Воспользуйтесь программой getorf из пакета EMBOSS. При этом используйте стандартный для бактерий (bacterial) генетический код, открытой рамкой считайте последовательность, начинающуюся со старт-кодона и заканчивающуюся стоп-кодоном.
getorf –find 1 –table 11
Finds and extracts open reading frames (ORFs)
Input nucleotide sequence(s): aald01000001.embl
protein output sequence(s) [aald01000001.orf]:
5) Создадим книгу Excel list.xls, включающую информацию обо всех открытых рамках считывания в данном фрагменте генома. Для каждой рамки указано: начало во фрагменте, конец во фрагменте, направление (прямое или обратное), число сходных последовательностей, найденных у E. coli при условии E-value<0,001, идентификатор самого близкого из найденных белков E. coli и E-value находки. Приведены только ненулевые результаты.
имя | Обозначение на схеме | начало | конец | направление | число находок | лучшая находка | |
>AALD01000001_1 | Yer1 | 15 | 314 | прямое | 3 | YDCR_ECOLI | 3,00E-19 |
>AALD01000001_2 | Yer2 | 777 | 2129 | прямое | 7 | ASTC_ECOLI | 4,00E-167 |
>AALD01000001_4 | Yer4 | 2138 | 3196 | прямое | 1 | ASTA_ECOLI | 3,00E-121 |
>AALD01000001_6 | Yer6 | 3196 | 4695 | прямое | 12 | ASTD_ECOLI | 0.0 |
>AALD01000001_7 | Yer7 | 4634 | 6061 | прямое | 1 | ASTB_ECOLI | 7,00E-172 |
>AALD01000001_8 | Yer8 | 6043 | 6999 | прямое | 1 | ASTE_ECOLI | 3,00E-76 |
6)Схема расположения этих генов в геноме Yersinia mollaretii
Yer1 Yer2 Yer4 Yer6 Yer7 Yer8
15-314 777-2129 (2138-3196) (3196-4695) (4634-6061) (6043-6999)
7) Составим схему лучших находок в геноме E.coli, для чего сначала соберем информацию о генах, кодирующих эти белки
Белок | ген | начало | конец | направление | описание |
YDCR_ECOLI |
ydcR |
1508027 |
1509433 |
Прямое |
fused predicted DNA-binding transcriptional regulator/predicted amino transferase; putative regulator; Not classified; |
ASTC_ECOLI |
astC |
1828786 |
1830006 |
Обратное |
succinylornithine transaminase, PLP-dependent; 2.6.1.17; 2.6.1.11; enzyme; Amino acid biosynthesis: Arginine; |
ASTA_ECOLI | astA | 1827755 | 1828789 | Обратное | arginine succinyltransferase; 2.3.1.109; |
ASTD_ECOLI | astD | 1826280 | 1827758 | Обратное | succinylglutamic semialdehyde dehydrogenase |
ASTB_ECOLI | astB | 1824940 | 1826283 | Обратное | succinylarginine dihydrolase [EC:3.5.3.23] |
ASTE_ECOLI | astE | 1823979 | 1824947 | Обратное | succinylglutamate desuccinylase (EC:3.5.1.-) |
Исходя из положений и описаний генов, можно предположить, что они объединены в один оперон, при этом первый ген кодирует регуляторный белок, связывающийся с ДНК, а остальные – ферменты, участвующие в метаболизма аминокислот – аргинина и пролина. Фрагмент схемы этого процесса из базы данных KEGG Карта генов оттуда же (тоже фрагмент) Оранжевый цвет значит группу процессов - Amino Acid Metabolism (метаболизм аминокислот) Таким образом можно предположить наличие оперона метаболизма аргинина и пролина у Yersinia mollaretii , так как сходные 5 генов Ecoli лежат в том же порядке и перекрываются сходным образом, хотя и направлены в другую сторону. Кроме того, существует и ген регулятора этого оперона, причем в отличие от генома ecoli, здесь он сближен с генами ферментов. Перекрытия генов в данном случае объясняются тем, что продукты генов участвуют в одном процессе, непосредственно друг за другом (см. схему) и, следовательно, должны экспрессироваться согласованно. Замечание: В процессе поиска с помощью SRS я вышла на базу данных KEGG: Kyoto Encyclopedia of Genes and Genomes, которая позволила наглядно предоставить связь как между генами (карта генома ecoli) так и между их продуктами (схема процесса). За что ей и благодарность, и ссылка
http://www.genome.jp/kegg/