|
||||||
Главная | Семестры | Скрипты | Обо мне | Ссылки |
|
|
Построение множественного выравнивания. Использование Pfam При выполнении этого задания я использовала результаты предыдущего практикума. После поиска BLAST позволяет скачать последовательности любых выбранных белков. Файл с шестью белками, образующими семейство гомологов с исходной последовательностью, можно посмотреть здесь в формате fasta. Этот файл называется seq6.fasta. Я построила множественное выравнивание этих последовательностей с помощью программы muscle на сервере компьютерного класса. Для этого, находясь в папке с исходным набором последовательностей, в командную строку надо ввести:
Результатом будет файл align_muscle.fasta. Графическую интерпретацию этого выравнивания можно посмотреть, скачав проект JalView, в окошке muscle. Существует много программ для построения таких выравниваний, для сравнения я воспользовалась программой mafft. Эта программа требует другого синтаксиса:
Выходным файлом является выравнивание align_mafft.fasta. Оно представлено в том же проекте в окошке mafft. Для сравнения этих двух программ можно построить выравнивание полученных выравниваний. Это удобно сделать с помощью muscle:
Открыв полученный файл (both.fasta) в JalView легко найти участки сходства. Добавив новую строку с комментариями, (equal) я отметила колонки, сопоставленные одинаково (единицами) и различно (нулями). JalView позволяет раскрасить выравнивание согласно этим комментариям. Однако не получается сохранить эту окраску, для ее восстановления достаточно в окошке both основного проекта нажать Colour > By Annotation. Фрагмент этого выравнивания (один из трех участков различия) представлен на рисунке 1. Различающиеся участки показаны зеленым цветом. Видно, что это негомологичные фрагменты, выравнивания отличаются расстановкой гепов. При этом вес выравнивания, видимо, не зависит от этого. Для подавляющего большинства колонок выравнивания идентичны, что может быть критерием их качества (при различиях в некоторых методах построения). Рисунок 1. Фрагмент сравнения двух выравниваний, полученных разными программами. Желтым цветом показаны одинаковые участки, зеленым - различающиеся Дальнейшая работа связана с Pfam - базой данных семейств белков. В ней содержится информация о доменах, входящих в состав различных белков и их возможных сочетаниях. С помощью поиска по этой базе данных я нашла информацию об исходной для первых заданий последовательности. Было найдено 16 близких белков, выполняющих одну функцию - построение капсида вируса. Домен Bromo_coat в этих последовательностях встречается без каких-либо других доменов, то есть известен только один тип архитектуры. Разнообразие организмов, включающих такую структуру, можно оценить по диаграмме, представленной на рисунке 2. В Pfam они называются Sunburst. Видно, что это только вирусы и вироиды, таксономически близкие исходному запросу. Рисунок 2. Диаграмма (Sunburst), показывающая организмы с доменом Bromo_coat При работе с этой базой данных есть возможность сохранить выравнивание наиболее сходных последовательностей семейства (seed). В данном случае, оно включает 3 последовательности. В проекте JalView представлено в окошке seed. Более интересный результат получается при анализе белка-регулятора транскрипции из семейства репрессоров, рассмотренного ранее. Домен TetR_N был найден в 63222 последовательностях, при этом встречается 89 различных типов архитектуры. Диаграмма, представляющая разнообразие видов с таким доменом, изображена на рисунке 3. Заметно значительно большее количество видов и сильные различия в таксонах. Представлены организмы из разных типов. Рисунок 3. Диаграмма (Sunburst), показывающая организмы с доменом TetR_N |
||||||||||||||||||
© Pogorelskaya Sasha | Last modification date: 19.02.15 |