Практикум 11 Построение парных выравниваний. Поиск по сходству.
1. Выборка гомологов белка Metallophosphoesterase[Ruminiclostridium thermocellum DSM 1313] при помощи программы BLASTP из базы Refseq. Я зарегистрировалась на сайте NCBI, вошла в личный кабинет, затем запустила программу Protein BLAST по алгоритму blastp (protein-protein BLAST) для базы данных Refseq (refseq_protein). При запуске с увеличенной до максимума выборкой (20000) находок оказалось 11542. При ограничении по таксону Bacteria находок было 11155. Тогда я ограничила по таксону Firmicutes, и находок оказалось 1686. Из них 168 находок, гомологичных моему белку по всей длине (query cover > 80%).
Находка/Параметр | Длина выравнивания | bit score | % идентичных остатков | % сходных остатков | E-value | Выравнивание из blast (в формате fasta) |
Лучшая:polynucleotide kinase-phosphatase [Ruminiclostridium thermocellum] | 870 | 1793 bits(4645) | 866/870(99%) | 869/870(99%) | 0.0 | Выравнивание |
Средняя:phosphoesterase [Streptococcus sanguinis] | 242 | 60.5 bits(145) | 67/269(25%) | 107/269(39%) | 1e-07 | Выравнивание |
Худшая:MULTISPECIES: hypothetical protein [Lactobacillus casei group] | 274 | 37.0 bits(84) | 47/175(27%) | 75/175(42%) | 9.9 | Выравнивание |
Используя, то что гомолог всей моей последовательности найден, если E-value < 1e-3 и не менее 70% запроса вошло в полученное выравнивание (Query cover), можно обнаружить, что 93 из полученных находок можно считать гомологами целой исходной последовательности. Ссылка на параметры поиска.
Ссылка на выборку 28 полных последовательностей гомологов моего белка в формате fasta.
2. Множественное выравнивание последовательностей из полученной выборки.С помощью Jalview и Muscle я построила множественное выравнивание полученной выборки. Вертикальные блоки отмечены символом B. На N концах у 4х последовательностях присутствуют невыровненные участки, на C концах все последовательности выровнены.
Рис. 1. Изображение выравнивания, полученного в задании 2.3. Построение глобальных и локальных парных выравниваний. Используя консольные программы needle и water на kodomo, я построила глобальное и локальное выравнивания худшей находки и моего белка. Удалив из множественного выравнивания все последовательности, кроме двух (худшей находки и моего белка), я получила глобальное выравнивание, полученное из множественного. Программа BLAST на сайте NCBI выдала другое локальное парное выравнивание данных последовательностей. Ссылка на проект JalView.
Рис. 2. Глобальное выравнивание с помощью needle.
Рис. 3. Глобальное выравнивание полученное из множественного.
Рис. 4. Локальное выравнивание с помощью water.
Рис. 5. Локальное выравнивание выданное BLAST
Рис. 6. Объединение выравниваний
4. Выравнивание выравниваний. Четыре полученных выравнивания: глобальное (выданное needle), глобальное (полученное из множественного), локальное (выданное water) и локальное (выданное BLAST) были помещены в одно окно JalView и объединены в 4 соответствующие группы. Затем они были выровнены.Глобальные выравнивания (полученное с помощью программы needle и построенное из множественного) немного длинее остальных. Локальные выравнивания местами схожи между собой, участки, на которых они не совпадают, показывают различия в их алгоритмах. На участке с координатами 50-90 выравнивания глобальное полученное из множественного и полученное с помощью программы blast различаются.
Рис. 7. Выравнивание выравниваний
Рис. 8. Несовпадающий участок.
5. Парные выравнивания последовательностей двух заведомо негомологичных белков. Для выравнивания я взяла свой белок и белок с идентификатором NP_295013.1, негомологичные друг другу. С помощью программ needle и water были получены парное глобальное и парное локальное выравнивания. Они были помещены в одно окно JalView и выровнены. По изображению очевидно, что белки негомологичны, так как процент консервативных очень маленький. И в выравнивании вторая последовательность сильно сдвинута относительно первой.
Рис. 8. Сравнение выравниваний. Первое выравнивание - глобальное полученное программой needle, нижнее - локальное полученное с помощью water.
Ссылки:
© Кузнецова Ксения, 2015