Выравнивание геномов

Выбор организмов для парного выравнивания.

К сожалению, первая моя идея о сравнении Hox-кластеров иглокожих провалилась и Dot-plot в этих выравниваниях ничего не показал, поэтому было решено сравнить геномы гаммапроеобактерии синегнойной палочки Pseudomonas aeruginosa (рис.1) разных штаммов, обе на уровне сборки "complete genome". Геномы я нашела в базе данных NCBI Genomes, перешела в базу данных Nucleotide и скачала геномы бактерии. Интерес данной грамотрицательной бактерии связан с ее влиянием на организм человека при абсцессах или в постреабилитационный период. В природе синегной палочка обитает в почве и воде, а к пациенту может попасть через медицинский персонал. Бактерия легко образует пленку на поверхности раны, где разрастается в колонию и обменивается факторами вирулентности и устойчивости к антибиотикам (рис.2).

lys25
Рис. 1.Внешнее вид Pseudomonas aeruginosa.
asn81
Рис. 2. Строение бактерии и образование биопленки.

Для анализа была выбрана хромосома Pseudomonas aeruginosa PAO1 с нуклеотидной записью NC_002516.2 и хромосома Pseudomonas aeruginosa strain 59 с записью NZ_CP123953.1.

Обсуждение Dot-plot.

Запуск BLAST происходил с настройками по умолчанию. Длина хромосомы у разных штаммов отличается на чуть больше чем 1 млн. п.о., из чего можно сделать вывод о наличии инделей в геноме. Проблема в выравнивании бактериальных геномов заключается в том, чтобы правильно выбрать место, с которого начинать выравнивание, а это сложность, так как геном кольцевой.

lys25
Рис. 3.Выравнивание blastn (настройки по умолчанию).
asn81
Рис. 4. Выравнивание megablast (worldsize=32).

По оси Оу- Pseudomonas aeruginosa PAO1.

По оси Ох- Pseudomonas aeruginosa strain 59.

Как и можно было ожидать, оба аглоритма BLAST показали одинаковую картину, с поправкой на шумы при использовании blastn. Настройки при выравнивании алгоритмом megablast были изменены на worldsize=32 для более "чистой" картины.

asn81
Рис. 5. Интересные участки для обсуждения.

Первый участок (900К-2.4М), обведенный красным, ничто иное как инверсия с транспозицей.

Второй участок (2.5М-5.2М), обведенный желтым, транспозиция.

Третий участок (5.2М-5.9М), обведенный зеленым, вероятно, и есть та делеция, которую можно было предположить из-за разницы в размерах хромосом.

Помимо вышеперечисленного, на протяжении всей линии наблюдаются точечные делеции/инверсии.