С помощью программы BLAST были найдены последовательности потенциальных гомологов, всего их 4859.
Работать с таким большим объёмом данных неудобно, поэтому я решила искать до 1000 потенциальных гомологов.
Здесь можно посмотреть на параметры поиска.
Для некоторых находок заполнили таблицу:
Находка | Организм | ID последовательности | bit score | % идентичных остатков | % сходных остатков | E-value |
Лучшая | Лучшая | WP_012310615.1 | 1347 | 99% | 99% | 0 |
Из середины | Streptococcus pneumoniae | WP_001812355.1 | 69.7 | 22% | 36% | 6,00E-09 |
Из середины | Staphylococcus equorum | WP_002511654.1 | 58.2 | 24% | 38% | 2,00E-05 |
Худшая | Halanaerobium hydrogeniformans hypothetical protein | WP_013406712.1 | 35.4 | 46% | 70% | 9,3 |
Выбрали 21 последовательность и с помощью программы Muscle построили множественное выравнивание. Ниже можно посмотреть на построенное выравнаивание:
Построили глобальное и локальное парные выравнивания белка и худшей находки из выборки. Использовали консольные программы needle и water на kodomo. Для того чтобы выходной файл прорамм имел fasta-формат, использовали флаг “-aformat fasta”Удалив остальные последовательности, получили парное выравнивание из построенного множественного. Скачали локальное выравнивание, выданное BLAST. поместили в одно окно в JalView и создали 4 группы.
Выравнивание NEEDLEВыравнивание выравниваний
Выровняли полученные выравнивания между собой.
Участок, найденный программами BLAST и water (564-729) совпадает
Участок, на котором выравнивания различаются (362-373)
Построили парные выравнивания последовательностей двух заведомо негомологичных белков. Использовали программы needle и water.