Предсказание парного выравнивания в Jalview,Needle,Water.

На прошлом семинаре мы активно обсуждали парное выравнивание, его алгоритм, достоверность и многие другие аспекты. В качестве задания нам было предложено заняться предсказанием парного выравнивания, используя уже знакомый JalView в комбинации с Needle, Water. В качестве исходного файла множественного выравнивания был использован файл с сервера Кодомо, который можно посмотреть и/или скачать по ссылке: Исходный файл . Как и в предыдущем задании, все файлы формата .jar будут выложено в конце.( файл Block1.jar)

Рисунок 1. Множественное выравнивание, из которого получено парное.

Рисунок 2. Парное выравнивание, полученное из множественного. Оба выравнивания можно скачать в формате jar по ссылке .


В качестве следующего задания, было предложено ознакомиться с программами Needle и Water соответственно. Needle строит глобальные выравнивания двух последовательностей( глобальное выравнивание - выравнивание полных последовательностей белков относительно друг друга, имеющее по возможности максимальный счет выравнивания). Использовать её нужно через сервер Кодомо и PuTTy. В качестве входных данных она треует две fasta последовательности двух белков соответственно, штрафы за первый гэп, за последущий гэп(если они идут один за другим). На выходе, если запустить Needle без параметров, получаем файла формата .needle, содержащий глобальное выравнивание, а перед ним аннотацию. Особенность файлов данного вида в том, что он указывает также сходство аминокислот( а не прямое совпадение типа A-A), проставляя сответственно одну или две точки. Чтобы получить файл выравнивания, имеющий структуру файла формата .fasta, необходимо указать в качестве опции запуска -aformat3 fasta. Следующая необходимая программа - Water. Она строит локальные выравнивания( это выравнивания неполной последовательности, при чем имеющие максимальный счет выравнивания). Работа с ней полностью аналогична работе с Needle. В качестве исходных файлов были использованы следующие файлы: первый и второй.
Таким образом для получения выравниваний были использованы следующие команды:
  • needle -aformat3 fasta
  • needle
  • water -aformat3 fasta
  • water
Для всех выравниваний были использованы следующие параметры:
  • Input sequence: 11.fasta
  • Second sequence: 22.fasta
  • Gap opening penalty: 10.0
  • Gap elongation penalty: 0.5
  • Список файлов можно посмотреть по ссылке или скачать в формате jar .

Рисунок 3. Выравнивание, полученное с помощью needle.

p class="podpis"> Рисунок 4. Выравнивание, полученное с помощью water. .


В качестве следующего задания было предложено построить выравнивание двух заранее негомологичных белков. В качестве второго белка я использовал белов Мухалёвой Елизаветы : ID Uniprot Q74D82_GEOS; белок пептидазы липопротеинов из Geobacter sulfurreducens PCA. Файл формата фаста: мой, Елизаветы. Необходимо было использовать needle и water. Список файлов можно посмотреть по ссылке или скачать в формате jar .

Рисунок 5. Выравнивание негомологичных последовательностей, полученное с помощью needle.

Рисунок 6. Выравнивание негомологичных последовательностей, полученное с помощью water. .

Таблица сравнения выравниваний

Последовательности Длина выравнивания Число совпадений Процент совпадений Число сходных остатков Процент сходных остатков Число гэпов Процент гэпов Число открытий гэпов
Две из множественного(глобальное) 138/137 40 29% 29 21% 2/12 1,5% 1/4
Две из множественного(локальное) 124/124 37 30% 28 22,6% 2/10 0,8%/2,4% 1/3
Две негомологичные(глобальное) 198/274 26 10,6%/7,6% 20 10,3%/7,3% 25/10 12,6%/3,6% 5/4
Две негомологичные(локальное) 146/146 23 15,75% 22 15,06% 37/18 25,3%/12,3% 4/3

Таблица 1. Сравнение выравниваний.

Для всех выравниваний информаиця получена с помощью программы infoalign, установленной на сервере Kодомо. В качестве аргумента она требует fasta файл выравнивания. Как видно из таблицы для второй пары последовательностей показатели невилики, это объяснимо, так как мы заранее знали, что они не гомологичны. Остальные различия достаточно легко объяснимы. Различие в числе совпадений возникает из-за длины рассматриваемых последовательностей в локальном и глобальном выравнивании. Из-за этого, в принципе, возникают все остальные различия.
В следующем задании необходимо было сравнить, выравнивдруг относительно друга выравнивания, полученные JalView и Needle соответственно. Выравнивание показано на рисунке 7. Проект в формате jar.

Рисунок 7. Сравнение парных выравниваний Jalview и Needle. .

На мой взгляд, полученное выравнивание, представленное на рис. 7, является наилучшим. Как видно, обе программы Jalview и Needle нашли очень хороший участок гомологичности. После этого участка программы по-разному распределили гэпы, поэтому выравняв отностительно гомологичного участка, тяжело что-то сказать о концах выравнивания, так как они мало совпадают между собой.
В качестве следующего задания было предложено проанализировать выравнивания, полученные в предыдущем пункте с использованием пространственной структуры. Из нужной папки на сервере Кодомо необходимо скачать все файлы. Сохранить выравнивание с названием aln_11.fasta. Запустить Sup_check, а потом открыть файл aln_11.pdb и применить к нему скрипт aln_11.src.Ошибка 1го рода: C_alpha атомы пары остатков в колонке выравнивания, отмеченной "+", в структуре, очевидно, не совмещаются. Ошибка 2го рода: C_alpha атомы двух остатков, очевидно, хорошо совмещаются, но соответствующие буквы либо не находятся в одной колонке, либо в одной колонке, но колонка не отмечена "+". В качестве результата приведен файл .jar с лейблами т.д. В итоге для 1 выравнивания: ошибок 1-го рода: 1, 2-го рода: 22. Для 2 выравнивания: ошибок 1-го рода: 0, 2-го рода: 33. Конечный файл в формате jar можно скачать по ссылке .

Рисунок 8. Сравнение парных выравниваний Jalview и Needle с пространственным расположением аминокислот. В формате jar по ссылке .



Просвиров Кирилл. 2014.