Поиск по сходству (нуклеотидный blast)
1. Определение таксономии и функции последовательности (из практикума 6).
Поиск осуществлен с помощью BLASTN (=”Somewhat similar sequences”), по банку данных nr/nt.
На данной картинке можно увидеть несколько первых находок с наилучшими параметрами E-Value (который в данном случае равен 0.00), покрытие входной последовательности 100% и процент идентичности от 99% до 97%. Стоит отметить, что общее количество находок с минимальным E-Value составляет 100 штук (процент идентичности варьирует от 99% до 89% процентов).
Так или иначе, все представленные находки относятся к гену рибосомной РНК различных представителей типа кольчатые черви (или Annelida).
Для работы была выбранна находка с наилучшими параметрами - Scoloplos acutissimus.
Рис.2 Scoloplos acutissimus.
Рис.3 Таксономия Scoloplos acutissimus.
Для сравнительного анализа выберем 6 из нескольких первых находок (а именно, представителей разных родов: Scoloplos, Phylo, Orbinia, Leodamas, Protoariciella, Leitoscolopos), все они кодируют ген 18S рибосомной РНК (=рибосомная РНК с коэффициентом седиментации 18 единиц Сведберга) у разных родов полихет семейства Orbiniidae. Ниже представлены выравнивания последовательностей относительно исходной.
Вид |
Identity |
Выравнивание в fasta-формате и выравнивание в jalview |
Изображение |
Scoloplos acutissimus voucher W.44175.001
|
99% |
||
Phylo michaelseni
|
98% |
||
Orbinia swani
|
97% |
||
Leodamas tribulosus voucher Ltr_001
|
97% |
||
Protoariciella uncinata
|
97% |
||
Leitoscoloplos bifurcatus voucher W.44938.001
|
97% |
Выводы:
Полученная последовательность в практикуме 6 — ген 18S рибосомной РНК.
Организм из семейства Orbiniidae.
2. Сравнение списков находок нуклеотидной последовательности 3-я разными алгоритмами blast.
Поиск был произведен по роду Scoloplos, максимальное количество находок — 100, остальные параметры по умолчанию.
Алгоритм Mega BLAST предназначен для выравнивания последовательностей, которые лишь немного отличаются друг от друга ( например - ошибки сиквенирования, генетическая изменчивость). В связи с тем, что паттерн для поиска данным алгоритмом составляет 28 букв (для сравнения у blastn ~ 11 букв) все последовательности с низким query cover не будут найдены => разница в количестве находок в 2 раза меньше по сравнению с алгоритмом Blastn.
Алгоритм discontiguous megablast является своеобразной версией Mega BLAST, разработанной специально для сравнения расходящихся последовательностей, в особенности последовательностей из разных организмов, которые имеют выравнивания с низкой степенью идентичности, где оригинальный Mega BLAST не эффективен.
3. Проверка наличия гомологов трех белков в геноме Amoeboaphelidium protococarum.
HSP7C_HUMAN - белок теплового шока человека, относящийся к шаперонам, который кодируется геном HSPA8 в восьмой хромосоме. Основная функция - фолдинг белков, участие в апоптозе, так же предотвращение сворачивание белков в ходе посттрансляционного транспорта в митохондрии и хлоропласты. Выравнивание HSP7C_HUMAN.
Результаты выравнивания:Число находок — 22.Лучшая находка (минимальный E-value в сочетании с максимальным % идентичности) — scaffold 199.E-value — 0.00% Identity — 78%Координаты — 1109250 — 1107430Score – 917
Исходя из полученных данных можно предположить наличие гомолога искомого белка у Amoeboaphelidium protococarum.
CISY_HUMAN – фермент, с помощью которого катализируется первая реакция в цикле Кребса, представляющая в свою очередь конденсацию ацетил Со-А с оксалоацетатом, что приводит к образованию цитрата. Выравнивание CISY_HUMAN.
Рис. 14 Механизм реакции.
Каждая субъединица цитратсинтазы представляет собой полипептид, состоящий из двух доменов: большого домена с довольно жесткой структурой и меньшео более гибкого домена; активный центр фермента располагается между этими двумя доменами. Оксалоацетат, который первым связывается с ферментом, вызывает сильные конформационные изменения в гибком домене, в результате чегоформируется центр связывания вторичного субстрата — ацетил-Со-А. При образовании в активном центре цитрил-Со-А вновь происходят конформационные изменения, которые на этот раз приводят к гидролизу тиоэфира и высвобождению Со-А-SH. Такое индуцирование соответствие между ферментом и его субстратом, а затем интермедиатом снижает вероятность преждевременного и непродуктивного расщепления тиоэфирной связи в ацетил-Со-А.
Рис.15 Структура цитратсинтазы.
Фермент цитратсинтаза располагается в митохондриальном матриксе эукариот, однако кодируется ядерным геномом. Синтез осуществляется на рибосомах цитоплазмы, а затем синтаза цитрата транспортируется в матрикс митохондрии.
Полученные данные говорят о большой вероятности наличия гомолога цитратсинтазы у данного организма.
TERT_HUMAN — теломераза - фермент, добавляющий особые повторяющиеся последовательности ДНК (TTAGGG у позвоночных) к 3'-концу цепи ДНК на участках теломер, которые располагаются на концах хромосом в эукариотических клетках. Теломеры содержат уплотнённую ДНК и стабилизируют хромосомы. Выравнивание TERT_HUMAN.
Результаты выравнивания:Число находок — 3Лучшая находка (минимальный E-value в сочетании с максимальным % идентичности) — scaffold-17.E-value — 8e-23% Identity — 26.58%Координаты — 610942 - 612552Score – 105
Судя по результатам, маловероятно наличие гомологов белка TERT_HUMAN в данном организме. Однако ген, кодирующий теломеразу у протиста Amoeboaphelidium protococarum быть непременно должен. Маленькое значение параметра идентичности может быть обусловлено тем, что доля интронов в гене, кодирующем теломеразу у человека превалирует над долей интронов в гомологичном гене у Amoeboaphelidium protococarum.
4. Поиск одного гена белка, закодированного в одном скэффолде ''Amoeboaphelidium''.
С помощью алгоритма megablast проведем поиск данной последовательности с ограничением по группам Опистоконты и Грибы.
Рис.16 Ограничение по Грибам
Рис.17 Ограничение по Опистоконтам
Исходя из низких значений E-value и большого процента идентичности, можно предположить, что в данном скэффолде представлен ген, кодирующий 60S рибосомный белок L7.