С помощью программы BLASTP на сайте NCBI [1] из базы данных Refseq были отобраны гомологичные белку Q83AU6 последовательности. Значение E-value при заданных настройках поиска оказалось существенно ниже 0.01 (последующая многократное изменение разных параметров поиска привело к похожему результату). Таким образом, в полученных данных присутствовало большое количество белков, гомологичных по всей длине данному.
Находки | Длина выравнивания | bit score | % идентичных отатков | % сходных остатков | E-value | Выравнивание (которое построил blast) |
WP_010958437.1 (лучшая) | 404 | 825 | 100 | 100 | 0.0 | Выравнивание |
WP_061397646.1 (средняя) | 395 | 446 | 56 | 74 | 6e-154 | Выравнивание |
WP_040240855.1 (худшая) | 360 | 68.2 | 24 | 42 | 6e-07 | Выравнивание |
Для выравнивания набора гомологичных последовательностей была использована консольная команда muscle. После выравнивания было выделено 9 вертикальных блоков a также удален С- концевой участок(т.к.довольно большой массив позиций не являлся набором консервативных колонок)
Для построения были взяты последовательности белков NP_820762.2 и WP_040240855.1 и использовались команды needle и water консоли kodomo
Изображение, полученное с помощью команды глобального выравнивания needle
Выравнивание было получено вставкой гэпов. Результат позволяет увидеть отличия в действии разных алгоритмов выравнивания. Ниже пример участка последовательности с различающимися выравниваниями:
В качестве пары негомологичных последовательностей рассмотрены белок NP_809341.1 и NP_820762.2. Выравнивание происходило с помощью команд water и needle (независимо друг от друга). После выравнивания последовательностей needle и water мы не видим ни одной консервативной позиции(последовательности негомологичны и выравнивания никак не совпадают). Следовательно, алгоритмы достоверно отразили реальную картину.
Файлы:
Проект со всеми заданиями
© Кучеренко Варвара 2015