PSI-BLAST

Текстовое описание:

В работе изучается поиск гомологичных последовательностей и их попарное выравнивание.

1.

На сетевом ресурсе NCBI в разделе BLAST был произведён отбор гомологов белка UDP-N-ацетилглюкозамин-карбоксивинилтрансферазы, вырабатываемого бактерией Hippea Maritima, для составления множественного выравнивания. В процессе подбора параметров было выяснено, что число результатов первой итерации становится приемлемым только после ограничения e-value шестидесятым порядком. (При e-value < 2e-100 число позиций в первой выдаче равно 466) Поэтому результат был ограничен таксоном b-proteobacteria и e-value=2е-150. (ссылка на параметры поиска). Спустя 4 итерации новые последовательности перестали появляться в выдаче:
Итерация Число находок e-value худшей предпороговой e-value лучшей запороговой Δ e-value
1 19 8e-157 2e-143 14 порядков
2 132 0 (1е-175) 2е-143 143 (32)порядка
3 133 0 (3е-170) 1е-17 17 (153) порядка
4 133 0 1е-17 17 порядков

3.

Файл с отобранными гомологами
Файл с их множественным выравниванием с помощью muscle

C помощью muscle -in seqdump.txt -out hip_homo.fasta за 7 секунд в 23 итерации было построено множественное выравнивание 133 выбранных последовательностей.

4.

C помощью jalView из множественного выравнивания, полученного в muscle, отобрано 10 наиболее типичных представителей. Отбор вёлся через утилиту "remove redundancy" с порогом избыточности 72. Получившееся выравнивание доступно здесь.
Графическое представление:

5.

Файл с типичными последовательностями
Файл с их множественным выравниванием с помощью mafft Отобрано 10 типичных представителей из 133 гомологичных последовательностей по выдаче jalView. Последовательности собраны в отдельный fasta-файл и заданы в качестве входного параметра утилите множественного выравнивания mafft: mafft hip_homo_typ_seq.fasta > hip_homo_typ_mafft.fasta

6.

Файл с выравниванием двух множественных выравниваний
демонстрацияв jalView
Для построения выравнивания выравниваний использованы множественные выравнивания, полученные в пунктах 4 и 5, и утилита muscle со следующими параметрами: muscle -profile -in1 hip_homo_typ_jal.fasta -in2 hip_homo_typ_mafft.fasta -out two_hip_aligns.fasta
В каждом столбце можно заметить два "периода" (повторяются наборы при разном в обеих частях порядке следования элементов) по 10 аминокислот, следовательно, оба выравнивания гомологичны.