Последовательность содержит участок гена гистона H3, так как абсолютное большинство лучших находок являются этим белком (рисунок 1).
Рисунок 1.
Алгоритм | Длина слова | M/M score | Число находок | Min E-value |
megablast | 28 | 1,-2 | 21 | 1e-177 |
blastn | 11 | 2,-3 | 29 | 3e-175 |
blastn | 7 | 1,-1 | 29 | 6e-178 |
Вниз по таблице чувствительность параметров растет: уменьшается длина слова, уменьшается штраф за mismatch. Так что количество находок, ограниченное таксоном Dendrochirotida растет. Для blastn с более чувствительными параметрами Min E-value меньше, чем для первого запуска blastn, видимо, потому что M/M score 2,-3 не дал этой хорошей находке найтись.
Параметры | Выдача | |
1. | ![]() | ![]() |
2. | ![]() | ![]() |
3. | ![]() | ![]() |
rRNA с координатами 6474-7223
Алгоритм | Длина слова | M/M score | Число находок |
megablast | 28 | 1,-2 | 412 |
blastn | 11 | 2,-3 | 1910 |
blastn | 7 | 1,-1 | 7193 |
Поиск не был ограничен таксоном, так заметнее, что число находок увеличивается для поиска с более чувствительными параметрами. Правда, при этом Min E-value везде 0.0 получился.
Параметры | Выдача | |
1. | ![]() | ![]() |
2. | ![]() | ![]() |
3. | ![]() | ![]() |
1. HSP71_YEAST из Saccharomyces cerevisiae, аскомицеты.
Белок теплового шока. При повышенной температуре белки начинают чаще неправильно укладываться, а экспрессия белков теплового шока усиливается, потому что они действуют как
шапероны. Обнаружен гомолог в скаффолде 199 с E-value 0.0, Identities 79%, Positives 90% и Gaps 0%, то есть, вероятно, с той же функцией.
2. TBB_NEUCR из Neurospora crassa, аскомицеты.
Бета-субъединица тубулина. Тубулин - основной белок микротрубочек. На бета-субъединице находится обменный сайт связывания ГТФ.
Найден гомолог в unplaced-665 с E-value 0.0, Identities 82%, Positives 88% и Gaps 5%. Есть небольшая вставка, а так - сходство высокое, так что функция скорее всего сохраняется.
3. TERT_SCHPO из Schizosaccharomyces pombe, аскомицеты.
TERT домен теломеразы, обратная транскриптаза. Добавляет повторы на концы хромомсом, которые синтезирует с РНК-матрицы. Лучшее выравнивание в скаффолде 17 с
E-value 1е-23, Identities 25%, Positives 47% и Gaps 13%. Выравнивание очень плохое, так что говорить о сохранении функции трудно, что очень странно, потому что у
Amoeboaphelidium protococcarum нормальные линейные хромосомы и теломераза тоже нужна.
В целом, белки теплового шока есть даже у бактерий, так что они, по идее, должны быть самыми древними и консервативными. У бактерий также есть гомологи тубулина (но не сам тубулин). Теломераза, конечно, появляется только у эукариот, а вот почему гомолога TERT домена нашлось у Amoeboaphelidium protococcarum - непонятно. Хотя, конечно, Schizosaccharomyces pombe относится к аскомицетам, которые с афелидами не так уж близки.
Рисунок 2.
Выбрала scaffold-57 длиной 110052 аминокислот. Лучшая находка - Glutamate/Leucine/Phenylalanine/Valine dehydrogenase-domain containing protein
из Lobosporangium transversale. Длина находки - 1019, выровнялось с 19 по 1017 аминокислоты. Примерные границы гена в скаффолде 57: 427-3465.
Рисунок 3.
Понизила порог E-value до 1e-20. Использовала megablast. Штаммы Salmonella enterica subsp. enterica serovar Typhi str. CT18 и Salmonella enterica subsp. enterica serovar Typhimurium str. LT2. Получилось:
Помимо небольших инделей есть две большие инверсии с центром в районе 1500 Kb и 4 Mb, длиной в 600 Kb и 800 Kb соответственно.
© Belousova Evgenia, 2018