Поиск по сходству. Построение парных выравниваний

С помощью программы BLAST были найдены последовательности потенциальных гомологов, всего их 4859. Работать с таким большим объёмом данных неудобно, поэтому я решила искать до 1000 потенциальных гомологов.
Здесь можно посмотреть на параметры поиска.

Для некоторых находок заполнили таблицу:

Находка Организм ID последовательности bit score % идентичных остатков % сходных остатков E-value
Лучшая Лучшая WP_012310615.1 1347 99% 99% 0
Из середины Streptococcus pneumoniae WP_001812355.1 69.7 22% 36% 6,00E-09
Из середины Staphylococcus equorum WP_002511654.1 58.2 24% 38% 2,00E-05
Худшая Halanaerobium hydrogeniformans hypothetical protein WP_013406712.1 35.4 46% 70% 9,3

Выбрали 21 последовательность и с помощью программы Muscle построили множественное выравнивание. Ниже можно посмотреть на построенное выравнаивание:


Ссылка на jvp-проект

Построили глобальное и локальное парные выравнивания белка и худшей находки из выборки. Использовали консольные программы needle и water на kodomo. Для того чтобы выходной файл прорамм имел fasta-формат, использовали флаг “-aformat fasta”Удалив остальные последовательности, получили парное выравнивание из построенного множественного. Скачали локальное выравнивание, выданное BLAST. поместили в одно окно в JalView и создали 4 группы.

Выравнивание NEEDLE
Выравнивани WATER
Выравниваание, полученное из множественного
Выравнивание BLAST

Выравнивание выравниваний


Ссылка на jvp-проект

Выровняли полученные выравнивания между собой.
Участок, найденный программами BLAST и water (564-729) совпадает
Участок, на котором выравнивания различаются (362-373)


Участок, где два выравнивания различны.

Построили парные выравнивания последовательностей двух заведомо негомологичных белков. Использовали программы needle и water.


Ссылка на jvp-проект


© Anastasia Teplova 2016