Eritis sicut Deus, scientes bonum et malum

Сайт студента ФББ Пензара Дмитрия

Филогенетические деревья Нахождение диагностических позиций в выравнивании Сравнение деревьев, построенных различными алгоритмами Укоренение филогенетических деревьев Проверка статьи о цитохромах b Построение деревьев по нуклеотидным последовательностям. Паралоги Ферменты. База KEGG. Работа с KEGG ORTHOLOGY Геномное окружение. База данных STRING

Нахождение диагностических позиций в выравнивании

В качестве одного из дополнительных заданий практикума 2 из темы "Филогенетические деревья" было предложено найти во множественном выравнивании диагностические позиции, т.е такие, по которым можно судить о принадлежности огранизма к тому или иному таксону.

Для этого мною был написан скрипт на Python с использованием библиотеки ETE2, предназначенной для работы с филогенетическими деревьями.

Алгоритм поиска диагностических позиций состои из двух этапов :

  1. Нахождение всех аминокислот, которые совпадают в данном множестве
  2. Удаление тех из них, которые есть в данной позиции и у других таксонов

На вход скрипт принимает файл множественного выравнивания, префикс к названию файлов результатов, а также файл в специальном формате, содержащий название и состав таксонов , и(или) файл, содержащий дерево в формате .nwk. (в случае указания обоих файлов диагностические позиции считаются для всех ветвей, содержащих > 1 элемента; для ветвей, соответствующих какому-либо таксону в выходном файле указывается название таксона, для остальных - 'No Name')

На вход скрипту были поданы следующие файлы:

Скрипт был запущен командой:

python find_diagn_pos.py -alf muscle_pth_aln.fasta -txf tax.txt.xls -rfp 
PTH_diagn_pos -trf natural_tree.nwk

На выходе были получены файлы, содержащие информацию о диагностических позициях:

На рис.1 и рис.2 приведено выравнивание, содержащиее выделенные диагностические позиции для рода Streptococcus и выравнивание, содержащее диагностические позиции для порядка Bacilli

All strains tree

Рис. 1. Диагностические позиции(выделены рамкой) для рода Streptococcus.

All strains tree

Рис.2. Диагностические позиции(выделены рамкой) для порядка Bacilli.
















Дата последнего изменения: 04.02.2015
Все материалы разрешается использовать только при извещении правообладателя.
© Penzar Dmitry. All rights reserved.
Flag Counter Valid HTML 4.01 Strict Valid CSS!