Выравнивание последовательностей

Таблица 1. Результаты поиска гипотетических гомологов белка XXXX_BACSU

  Поиск по БД Swiss-Prot Поиск по БД PDB Поиск по БД "nr"
1. Лучшая находка
Accession P39621 1QG8 NP_391670.1
E-value 5e-152 3e-152 1e-150
Вес (в битах) 536 533 536
Процент идентичности 100% 100% 100%
 
2. Сколько хороших кандидатов в гомологи найдено?
(число находок в списке описаний с E-value < 1E-10)
4 401 1
 
3. "Худшая из хороших" находка (последняя в выдаче с E-value < 1)
Номер находки в списке описаний 48 8056 9
Accession B4RCLO YP_004087142 1I84 S
E-value 0.89 0.99 0.84
Вес (в битах) 34.3 38.1 30.4
% идентичности 24% 28% 44%
% сходства 40% 50% 54%
Длина выравнивания 108 109 40
Координаты выравнивания (от-до, в запросе и в находке) 25-133 и 231-338 3-112 и 753-854 184-224 и 763-799
Число гэпов 7 4 10

Ответы на вопросы

1.Да,удалось
Структура в PDB
Информация о белке в NR
Информация о белке в SwissProt
2.Больше всего гомологов обнаружилось в NR,а наименьшее число в PDB.Возможно,различие объясняется временем создания систем,типом оказываемой им поддержки и нацеленностью на определённые задачи
3.Я воспользовался самой обширной поисковой системоа(NR) и получил 9350 результатов.E-value самой последней находки-10.Я выставил параметр max target sequences на максимально возможное значение(20000)

Поиск гомологов в других таксонах

При поиске с помощью фильтра первый же гомолог был найден в Эукариотах(Q6GV29;e-value:1e-04) "Худшая из хороших" находка (последняя в выдаче с E-value < 1)
 
Номер находки в списке описаний 1
Accession Q6GV29
E-value 1e-04
Вес (в битах) 45.8
% идентичности 24%
% сходства 45%
Длина выравнивания 118
Координаты выравнивания (от-до, в запросе и в находке) 4-122 и 16-132
Число гэпов 8

Сравнение выравниваний

Выравнивание,выдаваемое программой BlAST,сильно отличается и от глобального выравнивания(needle),и от частичного(water)
Программа выдаёт 3 частичных выравнивания(2-117;5-116.185-198;246-259.126-132;238-244),тогда как needle даёт 1-256;1-279,в water - 2-251;5-277
;(точка с запятой)-разделение 2 участков последовательностей одного выравнивания
.(точка)-окончание выравнивания и переход к следующему.
Needle
Water
Выдача программы BLAST



Дополнительное задание 3

По результатам сравнения 3 интерфейсов можно сказать,что наиболее удобный для использования-это BLAST на сервере NCBI.В плане выдачи результатов интерфейсы NCBI и Expasy мало отличаются дру от друга,тогда как вариант BLAST на сервери EBI сильно оличается:
1)непосредственное выравнивание последовательностей можно посмотреть в строке с определённой похожей на искомую последовательность
2)Такие параметры как Length,Score,Identities,Positives выводятся прямо в столбцах с результатами.
Если говорить об исходной странице задания параметров,то наиболее дружелюбный к пользователю-это интерфейс NCBI.На EBI представлено меньшее число поисковых систем,в которых ведётся поиск выравнивания,а в Expasy интерфеёс организован не очень удобно.

Дополнительное задание 2

Выравнивание программой BLAST с изменёнными параметрами
Особых отличий от выравнивания при параметрах по умолчанию с новыми настройками я не заметил.

Дополнительное задание 1

>sp|Q5X9A9.1|HASA_STRP6 RecName: Full=Hyaluronan synthase; AltName: Full=Hyaluronate
synthase; AltName: Full=Hyaluronic acid synthase; Short=HA synthase
Length=419
Score = 33.9 bits (76), Expect = 1.2, Method: Compositional matrix adjust.
Identities = 17/54 (31%), Positives = 38/54 (70%), Gaps = 2/54 (4%)



Query  3   KVSVIMTSYNK-SDYVAKSISSILSQTFSDFELFIMDDN-SNEETLNVIRPFLN  54 
KV+ ++ SYN+ ++ + +++ S+L+QT+ E++I+DD SN + + +I ++N
Sbjct 65 KVAAVIPSYNEDAESLLETLKSVLAQTYPLSEIYIVDDGSSNTDAIQLIEEYVN 118
Мне кажется,что 2 белка могут быть гомологами,потому что несмотря на высокое E-value у выравивания достаточно близки.
В часности,гэпов немного а схожесть достаточно высокая