Сравнение геномов

Третий семестр Главный сайт



Задание 1

Brucella Abortus
Brucella pinnipedialis
Для рассмотрения я взял хромосому 1 бактерий Brucella Abortus и Brucella pinnipedialis.
Этому предествовали долгие поиски двух хоть сколько-нибудь интересных бактерий рода Brucella.
Результаты выравнивания: Query Cover = 99%, E.value = 0.0, Ident = 99%.

Brucella Abortus по оси Х. Видно, что произошедшие изменения - инверсии двух частей хромосомы.

Лог создания пангенома
TSV-файл (список геномов)
G-блоки:
chr1	+Arizona&chr1&c	g4x377015 >		g4x311867 >	g4x38808 >	g4x25509 >		g4x516425 >
chr1	+Hino&chr1&c	g4x377015 >		g4x311867 >	g4x38808 >	g4x25509 >		g4x516425 >
chr1	+Hlp2&chr1&c	g4x377015 >		g4x25509 <	g4x38808 >	g4x311867 <		g4x516425 >
chr1	+Iowa&chr1&c	g4x377015 >		g4x311867 >	g4x38808 >	g4x25509 >		g4x516425 >


S-блоки:
Количество: 114
Суммарная длина: 1252736
Процент от генома: 99.01%
Процент консервативных позиций в объединенном выравнивании: 0.995755



R-блоки:
Два наиболее частых:

				Arizona	Hino	Hlp2	Iowa
r22x159: 22 повтора, длина 159.	 2	7	7	6
r16x225. 16 повторов, длина 225	 1	6	6	3



H-блоки. Делеции.
Все H-блоки и их фрагменты. Можно заметить, что все кроме одного блоки трехфрагментные. 
Кроме того, штамм Hlp2 не имеет этих блоков вовсе.
	Arizona	Hino	Hlp2	Iowa
h3x525	1	1	0	1
h3x251	1	1	0	1
h3x233	1	1	0	1
h3x225	1	1	0	1
h3x199	1	1	0	1
h3x168	1	1	0	1
h3x111	1	1	0	1
h3x101	1	1	0	1
h2x115	0	1	0	1




U-блоки

				
		Arizona	Hino	Hlp2	Iowa
u1x940		0	0	1	0
u1x665		0	0	1	0
u1x196		0	0	1	0
u1x195		0	0	1	0
u1x174		0	1	0	0
u1x135		0	0	1	0
u1x130		0	0	1	0
u1x124		0	0	1	0
u1x110		0	0	1	0
u1x110n1	0	0	1	0
u1x107		0	0	1	0
u1x100		0	0	1	0


Уникальный фрагмент штамма Нino очень интересен, в нем закодированна tRNA-Glu.
Более того, это единственная копия этого гена у этого штамма. Как она попала в уникальный блок,
будучи необходимым компонентом каждой клетки - непонятно.


Расхождения:

В одном из H-блоков h3x225 есть гипотетический белок (фиолетовый), хотя на двух аналогах он вполне определен



А, например, на s4x33461 есть названный ген, хотя все его аналоги - гипотетические белки.

Сайт находится в стадии разработки


© 2014 Рюмин Константин