Гомолог белка Fusobacterium nucleatum subsp. nucleatum ATCC 25586
Я зарегистрировалась на сайте NCBI, вошла в личный кабинет и запустила программу Protein BLAST, выбрав алгоритм blastp (protein-protein BLAST), база данных - Reference proteins (refseq_protein). Я поставила максимальную выдачу(20000), при этом у самой худшей находки E-value составил 2,1.
Ссылка на параметры поискаИтоговое число результатов составило 20000(включая исходную последовательность). Среди них все гомологичны исследуемогу белку по всей длине (query cover > 80%) Используя условный критерий гомологичности (E-value<0.001 и Query cover не менее 70%) мы получаем, что в базе данных вероятно более 20000 гомоглогов целой исходной последовательности. В табице представлено сравнение по ключевым параметрам нескольких находок: лучшей - 1, худшей - 3 и из середины списка - 2.
Организм | Длина выравнивания | Ident | E value | Query cover | Выравнивание |
Lactate dehydrogenase [Fusobacterium nucleatum] | 677 | 100% | 0,0 | 100% | Ссылка |
2-hydroxyacid dehydrogenase [Neisseria meningitidis] | 127 | 31% | 1e-30 | 94% | Ссылка |
glycerate dehydrogenase [Vibrio nigripulchritudo] | 39,7 | 95% | 4e-26 | 25% | Ссылка |
Множественное выравнивание последовательностей из полученной выборки
С помощью Jalview и Muscle я построила множественное выравнивание полученной выборки. Вертикальные блоки отмечены символом B, их не много. Также были выделены некоторые группы, они обозначены H, их достаточно много. На N- и C-концах многих последовательностей присутствовали длинные невыровненные участки, различные у разных находок, что не свидетельствует об отсутствии гомологии между последовательностями в целом.
Построение глобальных и локальных парных выравниваний
Для выполнения этого задания необходимо было воспользоваться программами Needle и Water через сервер Kodomo с помощью PuTTy.
Needle строит глобальные выравнивания двух последовательностей. Water строит локальные выравнивания. По умолчанию needle выдает файлы формата .needle, а water - файлы формата .water, содержащие выравнивание и аннотацию, чтобы получить выходной файл в fasta-формате, необходимо в качестве опции запуска указать -aformat3.fasta.
Для построения выравниваний использовались WP_012172412.1 (мой белок) и XP_009174666.1.
Глобальное выравнивание полученное с омощью NeedleВыравнивание выравниваний
Четыре полученных выравнивания: глобальное (выданное needle), глобальное (полученное из множественного), локальное (выданное water) и локальное (выданное BLAST) были помещены в одно окно JalView и объединены в 4 соответствующие группы. Затем я провела выравнивание четрех выравниваний вручную.
Между различными выравниваниями были найдены различия. Так, больше всего различий было обнаружено между глобальными выравниваниями. Выравнивания, полученные с помощью Needle и Water совпали почти полностью, не считая, естественно, обрезанных Water участков. Локальные выравнивания Water и Blast различаются по длине, но почти полностью совпадают. Глобальные выравнивания построенные с помощью Needle и из множественного также местами различаются.
Участок несовпадения выравниваний
Выравнивание негомологичных последовательностей
Я использовала последовательность своего белка и белка WP_003452659.1 С помощью Needle и Water я получила глобальное и локальное выравнивания, котрые затем поместила в одно окно JalView и произвела выравнивание относительно друг друга. Выравнивания в имеют достаточное колличество совпадений, но несовподающих участков больше, чем при выравнивании гомологичных последовательностей. Это может говорить о ненадежности результатов выравнивания негомологичных структур.Также можно посмотреть все полуенные выравнивания в JalView-проекте: Проект в формате JVP