Московский Государственный Университет имени М.В.Ломоносова

Факультет Биоинженерии и Биоинформатики

Учебный сайт Сеферяна Мелика

Главная

I Семестр

II Семестр

III Семестр

Проекты

Официальный сайт ФББ

Официальный сайт МГУ

Полезные ссылки

Зачетное задание.

Задание: по данному фрагменту (49001..56000) генома бактерии Regiella insecticola, определить, где в этом фрагменте закодированы белки, похожие на известные белки бактерии Escherichia coli штамма K12.

Полный протеом E.coli получаем командой:

	seqret sw:*_ECOLI
	
Далее создаем индексные файлы для последующего поиска:

	formatdb -i 3mg1_ecoli.fasta -p T -n ec
	
Набор всех возможных открытых рамок считывания (длиной не менее 240 нт) получаем командой:

	getorf -minsize 240 -find 1 -table 11 
	
Файл с ORFами: 49k.orf, содержит 10 рамок.

Теперь ищем гомологи этих ORFов в проеоме E.coli:

	blastall -p blastp -d ec -i 49k.orf -m 8 -e 0.001
	
Получаем файл c находками (Evalue > 0.001)

В таблице приведены данные о находках.

Ниже приведены только те ORFы, для которых были найдены гомологи в геноме E.coli:

номер рамки считывания начало во фрагменте конец во фрагменте направление количество гомологов в геноме E.coli Идентификатор самого близкого из найденных белков E. coli Evalue
1 2067 3014 прямое 4 DAPA_ECOLI 1E-112
2 3031 4077 прямое 1 NLPB_ECOLI 1E-103
3 4140 4892 прямое 1 PUR7_ECOLI 1E-106
4 4968 5381 прямое 1 SECG_ECOLI 2E-42
5 5861 6352 прямое 1 RIMP_ECOLI 2E-64
6 6379 6999 обратное 1 NUSA_ECOLI 1E-82

Гипотетические гены во фрагменте 49001-56000 записи AC200764:

 <= 3'--------------------------------------------------------------------------------------------[nusa, 6379-6999]--5'

 => 5'--[dapa, 2067-3014]-[nplb, 3031-4077]-[pur7, 4140-4892]-[secg, 4968-5381]-[rimp, 5861-6352]--------------------3'
	
Расположение генов в геноме E.coli (по данным записи AP009048):


 <= 3'--[pur7, 2595561-2596274]---[nplb, 2596487-2597521]---[dapa, 2597538-2598416]----------------------------------5'

 <= 3'----------------------------------[nusa, 3315894-3317381]---[rimp, 3317409-3317861]---[secg, 3322028-3322360]--5'
	
Группа из трех генов ( dapa, nlpb, pur7 ) в геноме E.coli располагается точно так же как и в геноме Regiella insecticola ( в том же порядке и так же близко друг к другу ), что свидетельствует о чрезвычайной консервативности их взаимного расположения.

Гены nusa, rimp и secg также располагаются рядом в геноме E.coli, но между rimp и secg находятся 2 гена кодирующих тРНК и 2 гена, кодирующих белки (причем один из них расположен на комплементарной цепочке). Кроме того nusa расположен на комплементарной цепочке в геноме Regiella insecticola. Тем не менее, расположение генов в этом случае также консервативно.

© Сеферян Мелик, 2008 seferyan_m@mail.ru