1. Определение таксономии и функции последовательности (из практикума 6).

Поиск осуществлен с помощью BLASTN (=”Somewhat similar sequences”), по банку данных nr/nt.

На данной картинке можно увидеть несколько первых находок с наилучшими параметрами E-Value (который в данном случае равен 0.00), покрытие входной последовательности 100% и процент идентичности от 99% до 97%. Стоит отметить, что общее количество находок с минимальным E-Value составляет 100 штук (процент идентичности варьирует от 99% до 89% процентов).

Так или иначе, все представленные находки относятся к гену рибосомной РНК различных представителей типа кольчатые черви (или Annelida).

Для работы была выбранна находка с наилучшими параметрами - Scoloplos acutissimus.

Рис.2 Scoloplos acutissimus.

Рис.3 Таксономия Scoloplos acutissimus.

Для сравнительного анализа выберем 6 из нескольких первых находок (а именно, представителей разных родов: Scoloplos, Phylo, Orbinia, Leodamas, Protoariciella, Leitoscolopos), все они кодируют ген 18S рибосомной РНК (=рибосомная РНК с коэффициентом седиментации 18 единиц Сведберга) у разных родов полихет семейства Orbiniidae. Ниже представлены выравнивания последовательностей относительно исходной.

Вид
Identity
Выравнивание в fasta-формате и выравнивание в jalview
Изображение
Scoloplos acutissimus voucher W.44175.001
99%
Phylo michaelseni
98%
Orbinia swani
97%
Leodamas tribulosus voucher Ltr_001
97%
Protoariciella uncinata
97%
Leitoscoloplos bifurcatus voucher W.44938.001
97%

Выводы:

Полученная последовательность в практикуме 6 — ген 18S рибосомной РНК.

Организм из семейства Orbiniidae.

2. Сравнение списков находок нуклеотидной последовательности 3-я разными алгоритмами blast.

Поиск был произведен по роду Scoloplos, максимальное количество находок — 100, остальные параметры по умолчанию.

Алгоритм Mega BLAST предназначен для выравнивания последовательностей, которые лишь немного отличаются друг от друга ( например - ошибки сиквенирования, генетическая изменчивость). В связи с тем, что паттерн для поиска данным алгоритмом составляет 28 букв (для сравнения у blastn ~ 11 букв) все последовательности с низким query cover не будут найдены => разница в количестве находок в 2 раза меньше по сравнению с алгоритмом Blastn.

Алгоритм discontiguous megablast является своеобразной версией Mega BLAST, разработанной специально для сравнения расходящихся последовательностей, в особенности последовательностей из разных организмов, которые имеют выравнивания с низкой степенью идентичности, где оригинальный Mega BLAST не эффективен.

3. Проверка наличия гомологов трех белков в геноме Amoeboaphelidium protococarum.

HSP7C_HUMAN - белок теплового шока человека, относящийся к шаперонам, который кодируется геном HSPA8 в восьмой хромосоме. Основная функция - фолдинг белков, участие в апоптозе, так же предотвращение сворачивание белков в ходе посттрансляционного транспорта в митохондрии и хлоропласты. Выравнивание HSP7C_HUMAN.

Результаты выравнивания:
Число находок — 22.
Лучшая находка (минимальный E-value в сочетании с максимальным % идентичности) — scaffold 199.
E-value — 0.00
% Identity — 78%
Координаты — 1109250 — 1107430
Score – 917

Исходя из полученных данных можно предположить наличие гомолога искомого белка у Amoeboaphelidium protococarum.

CISY_HUMANфермент, с помощью которого катализируется первая реакция в цикле Кребса, представляющая в свою очередь конденсацию ацетил Со-А с оксалоацетатом, что приводит к образованию цитрата. Выравнивание CISY_HUMAN.


Рис. 14 Механизм реакции.

Каждая субъединица цитратсинтазы представляет собой полипептид, состоящий из двух доменов: большого домена с довольно жесткой структурой и меньшео более гибкого домена; активный центр фермента располагается между этими двумя доменами. Оксалоацетат, который первым связывается с ферментом, вызывает сильные конформационные изменения в гибком домене, в результате чегоформируется центр связывания вторичного субстрата — ацетил-Со-А. При образовании в активном центре цитрил-Со-А вновь происходят конформационные изменения, которые на этот раз приводят к гидролизу тиоэфира и высвобождению Со-А-SH. Такое индуцирование соответствие между ферментом и его субстратом, а затем интермедиатом снижает вероятность преждевременного и непродуктивного расщепления тиоэфирной связи в ацетил-Со-А.


Рис.15 Структура цитратсинтазы.

Фермент цитратсинтаза располагается в митохондриальном матриксе эукариот, однако кодируется ядерным геномом. Синтез осуществляется на рибосомах цитоплазмы, а затем синтаза цитрата транспортируется в матрикс митохондрии.

Полученные данные говорят о большой вероятности наличия гомолога цитратсинтазы у данного организма.

TERT_HUMAN — теломераза - фермент, добавляющий особые повторяющиеся последовательности ДНК (TTAGGG у позвоночных) к 3'-концу цепи ДНК на участках теломер, которые располагаются на концах хромосом в эукариотических клетках. Теломеры содержат уплотнённую ДНК и стабилизируют хромосомы. Выравнивание TERT_HUMAN.

Результаты выравнивания:
Число находок — 3
Лучшая находка (минимальный E-value в сочетании с максимальным % идентичности) — scaffold-17.
E-value — 8e-23
% Identity — 26.58%
Координаты — 610942 - 612552
Score – 105

Судя по результатам, маловероятно наличие гомологов белка TERT_HUMAN в данном организме. Однако ген, кодирующий теломеразу у протиста Amoeboaphelidium protococarum быть непременно должен. Маленькое значение параметра идентичности может быть обусловлено тем, что доля интронов в гене, кодирующем теломеразу у человека превалирует над долей интронов в гомологичном гене у Amoeboaphelidium protococarum.

4. Поиск одного гена белка, закодированного в одном скэффолде ''Amoeboaphelidium''.

Файл с контигами; файл scaffold223.fasta

С помощью алгоритма megablast проведем поиск данной последовательности с ограничением по группам Опистоконты и Грибы.

Рис.16 Ограничение по Грибам


Рис.17 Ограничение по Опистоконтам

Исходя из низких значений E-value и большого процента идентичности, можно предположить, что в данном скэффолде представлен ген, кодирующий 60S рибосомный белок L7.