Отчет по практикуму 11. Построение парных выравниваний. Поиск по сходству.

На этой странице выложен отчет по практикуму 11.

1.При запуске прграммы BLAST найдено 100 последовательностей. Оказалось, что при стандартной выдаче в 100 гомологов у самой худшей находки e-value составляет 9e-175. Тогда я ограничил поиск доменом Bacteria, типом Протеобактерии, классом Гамма-протеобактерии, порядком Vibrionales. Тогда e-value наихудшей находки составляет 9.3, найдено 429 последовательностей, e-value наилучшей находки составляет 0.0.

Находка Длина выравнивания Bit score% идентичных% сходныхE-valueВыравнивание
MULTISPECIES: fatty acid metabolism regulator protein [Vibrio] 279 584 bits(1506)1001000.0Выравнивание
transcriptional regulator PdhR [Aliivibrio wodanis] 256 49.3 bits(116)39543e-05Выравнивание
GntR family transcriptional regulator [Vibrio antiquarius] 471 32.7 bits(73)32529.3Выравнивание

170 найденных последовательностей можно считать гомологами исходной последовательности, так как E-value < 1e-3 и не менее 70% запроса вошло в полученное выравнивание (Query cover). Для этих 169 из 170 находок в полученное выравнивание вошло не менее 99% запроса (Query cover>=99%). У всех последовательностей, кроме этих 170 последовательностей Query cover меньше 70%.
Выборка 25 полных последовательностей гомологов моего белка в формате fasta

2.
Выравнивание 25 полных последовательностей гомологов моего белка.
Выравнивание в формате fasta.
Выравнивание в формате msf.
Hа N- или C-конце длинные невыровненные участки, которые различны у разных находок отсутствуют.

3.Глобальное парное выравнивание моего белка и худшей находки из выборки в формате fasta, построенное с помощью программы needle.
Локальное парное выравнивание моего белка и худшей находки из выборки в формате fasta, построенное помощью программы water.

Выравнивание полученное из множественного.
Выравнивание в формате fasta.
Выравнивание в формате msf.
Выравнивание, выданное BLAST.

4.
На этой картинке представлены выровненные полученные выравнивания:выравнивание, выданное программой needle и выравнивание, полученное из множественного.
Выравнивание в формате fasta.
Выравнивание в формате msf.

На этой картинке представлены выровненные полученные выравнивания:выравнивание, выданное программой water и выравнивание, выданное BLAST.
Выравнивание в формате fasta.
Выравнивание в формате msf.
Участки, найденные программами BLAST и water совпадают за исключением последней аминокислоты, где water выдает гэп. Участки различны в конце выравнивания.

Участок, где выравнивания различны.
Выравнивание участка в формате fasta.
Выравнивание участка в формате msf.

На этой картинке представлены выровненные полученные выравнивания:выравнивание, выданное программой needle, выданное программой water, выравнивание, выданное BLAST и выравнивание, полученное из множественного.

Выравнивание в формате fasta.
Выравнивание в формате msf.

5.

Выравнивание 2 негомологичных последовательностей программами needle и water и сравнение результатов.



Выравнивание, полученное с помощью программы water.
Выравнивание в формате fasta.
Выравнивание в формате msf.

Выравнивание, полученное с помощью программы needle.
Выравнивание в формате fasta.
Выравнивание в формате msf.

Выровненные полученные выравнивания.
Выравнивания в формате fasta.
Выравнивания в формате msf.
Несовпадения выравниваний, полученных с помощью программ needle и water имеются на большинстве участков, совпадений мало.
Ссылка на весь проект.