Практикум 8. BLAST.


Задание 1.

Последовательность содержит участок гена гистона H3, так как абсолютное большинство лучших находок являются этим белком (рисунок 1).


Рисунок 1.




Я рассмотрела 6 лучших находок, распределенных между 4 семействами: Ypsilothuriidae, Cucumariidae, Psolidae, Paracucumidae(порядок Dendrochirotidae, класс Holothuroidea, тип Echinidermata). H3 в этих семействах в принципе очень похож (первые 6 последовательностей в выравнивании).
Выравнивание JalView
Query (последняя последовательность) больше всего похож на H3 вида Abyssocucumis abyssorum из семейства Cucumariidae (вставка вначале совпадает). Значит, скорее всего, это - семейство Cucumariidae. Насчет рода и вида трудно сказать.



Задание 2.

АлгоритмДлина словаM/M scoreЧисло находокMin E-value
megablast281,-2211e-177
blastn112,-3293e-175
blastn71,-1296e-178

Вниз по таблице чувствительность параметров растет: уменьшается длина слова, уменьшается штраф за mismatch. Так что количество находок, ограниченное таксоном Dendrochirotida растет. Для blastn с более чувствительными параметрами Min E-value меньше, чем для первого запуска blastn, видимо, потому что M/M score 2,-3 не дал этой хорошей находке найтись.



ПараметрыВыдача
1.
2.
3.


rRNA с координатами 6474-7223

АлгоритмДлина словаM/M scoreЧисло находок
megablast281,-2412
blastn112,-31910
blastn71,-17193

Поиск не был ограничен таксоном, так заметнее, что число находок увеличивается для поиска с более чувствительными параметрами. Правда, при этом Min E-value везде 0.0 получился.



ПараметрыВыдача
1.
2.
3.


Задание 3.

1. HSP71_YEAST из Saccharomyces cerevisiae, аскомицеты.
Белок теплового шока. При повышенной температуре белки начинают чаще неправильно укладываться, а экспрессия белков теплового шока усиливается, потому что они действуют как шапероны. Обнаружен гомолог в скаффолде 199 с E-value 0.0, Identities 79%, Positives 90% и Gaps 0%, то есть, вероятно, с той же функцией.

2. TBB_NEUCR из Neurospora crassa, аскомицеты.
Бета-субъединица тубулина. Тубулин - основной белок микротрубочек. На бета-субъединице находится обменный сайт связывания ГТФ.
Найден гомолог в unplaced-665 с E-value 0.0, Identities 82%, Positives 88% и Gaps 5%. Есть небольшая вставка, а так - сходство высокое, так что функция скорее всего сохраняется.

3. TERT_SCHPO из Schizosaccharomyces pombe, аскомицеты.
TERT домен теломеразы, обратная транскриптаза. Добавляет повторы на концы хромомсом, которые синтезирует с РНК-матрицы. Лучшее выравнивание в скаффолде 17 с E-value 1е-23, Identities 25%, Positives 47% и Gaps 13%. Выравнивание очень плохое, так что говорить о сохранении функции трудно, что очень странно, потому что у Amoeboaphelidium protococcarum нормальные линейные хромосомы и теломераза тоже нужна.


В целом, белки теплового шока есть даже у бактерий, так что они, по идее, должны быть самыми древними и консервативными. У бактерий также есть гомологи тубулина (но не сам тубулин). Теломераза, конечно, появляется только у эукариот, а вот почему гомолога TERT домена нашлось у Amoeboaphelidium protococcarum - непонятно. Хотя, конечно, Schizosaccharomyces pombe относится к аскомицетам, которые с афелидами не так уж близки.

Рисунок 2.





Задание 4.

Выбрала scaffold-57 длиной 110052 аминокислот. Лучшая находка - Glutamate/Leucine/Phenylalanine/Valine dehydrogenase-domain containing protein из Lobosporangium transversale. Длина находки - 1019, выровнялось с 19 по 1017 аминокислоты. Примерные границы гена в скаффолде 57: 427-3465.

Рисунок 3.




Задание 5.

Понизила порог E-value до 1e-20. Использовала megablast. Штаммы Salmonella enterica subsp. enterica serovar Typhi str. CT18 и Salmonella enterica subsp. enterica serovar Typhimurium str. LT2. Получилось:


Помимо небольших инделей есть две большие инверсии с центром в районе 1500 Kb и 4 Mb, длиной в 600 Kb и 800 Kb соответственно.


© Belousova Evgenia, 2018