Используя Blastx, который ищет белки, используя транслированную ДНК, мне удалось получить 100 выравниваний с консенсусной
последовательностью из
практикума 6. Все найденные по последовательности белки были
Цитохром С оксидазой (субъединица I), частичный митохондриальный, из
разных видов голожаберных моллюсков (Goniodorididae). Чтобы проверить результат, я использовала Megablast для поиска близких к моей нуклеотидных
последовательностей. Результат оказался тот же. Судя по тому, что в обоих случаях лучшие выравнивания (с наибольшими весом, процентами идентичности,
покрытием и наименьшим E-value), были связаны с организмом
Ancula gibbosa, можно предположить, что и секвенированная последовательность (Пр.6)
была выделена из этого организма.
В Megablast лучшей найденной последовательностью с весом 1188 и покрытием 93% была последовательность, содержащая не только частичную кодирующую
последовательность
1 субъединицы цитохром C оксидазы, но и
гены tRNA-Val и большой рибосомальной субъединицы (полные посл-ти).
CO I является каталитической субъединицей фермента цитохром С оксидазы, катализирующего окисление кислорода в воду. Этот белок участвует в
реакциях окислительного фосфорилировании, которое является частью энергетического метаболизма.
Сравнение производилось по трем поискам с алгоритмами, представленными в таблице 2. Поиск производился по консенсусной
последовательности и по
CDS из генома вируса из прошлого
практикума
В процессе поиска по трем разным алгоритмам, требуемое время последовательно увеличивалось от megablast к чувствительному
blastn. Первое отличие, которое бросилось в глаза при поиске по консенсусной последовательности - это количество последовательностей с нулевым E-value: при использовании megablast таких последовательностей
было 4, а в обоих случаях с blastn все 50 (поиск производился с ограничением на количество находок - 50). Вес лучших находок также различался (см. Табл.2).
Результаты с точки зрения количества находок по таксономии тоже немного различался от алгоритма к алгоритму.
При поиске по CDS последовательности вируса нашлось не так много последовательностей, как при предыдущем поиске. Одним из параметров
поиска был "Expect threshold" равный 1 (в предыдущем поиске по умолчанию было 10). С помощью megablast удалось найти 3 последовательности с полным покрытием
и почти 100% идентичностью. При поиске blastn удалось найти одни и те же 4 последовательности, но при разных параметрах для этих последовательностей
незначительно менялись вес и E-value. Таким образом, выдача blastn и megablast в этом случае отличалась всего на одну последовательность.
В этом задании нужно было проверить наличие гомологов трех белков в геноме
Amoeboaphelidium protococcarum. Я выбрала
белки, которые, как мне кажется, должны быть у всех эукариот: гистон H3 (H31_TETTH), убиквитин-конъюгирующий фермент E2 R1(UB2R1_HUMAN)
и хроматин-связывающий белок(регулятор хромосомной конденсации) (RCC1_HUMAN). Информацию о белках я нашла с помощью UniProt. Я использовала следющие команды:
seqret sw:h31_tetth his3.fasta
seqret sw:ub2r1_human ub2.fasta
seqret sw:rcc1_human rcc1.fasta
makeblastdb -in X5.fasta -dbtype nucl -out pr8.db
tblastn -query his3.fasta -db pr8.db -out his.out
tblastn -query ub2.fasta -db pr8.db -out ub2.out
tblastn -query rcc1.fasta -db pr8.db -out rcc1.out
Результаты получились следующие: с большой вероятностью в геноме
Amoeboaphelidium protococcarum есть гомолог белка гистона H3
Tetrahymena thermophila (инфузория).
Этот белок является основным компонентом нуклеосомы. Нуклеосомы обертывают и уплотняют ДНК в хроматин, ограничивая доступ к ДНК ферментов, требующих ДНК в качестве субстрата.
Таким образом, гистоны играют центральную роль в регуляции транскрипции, репарации ДНК, репликации ДНК и стабильности хромосом.
Для последовательности
гистона H3 удалось получить несколько хорших выравниваний с последовательностями из генома
Amoeboaphelidium protococcarum, причем
три лучших выравнивания были одинаковы (Score = 221 bits (562), Expect = 3e-66, Identities = 112/135 (83%), Positives = 123/135 (91%), Gaps = 1/135 (1%)),
но из разных скэффолдов (scaffold-126, scaffold-104 (2x)) и рамками считывания -3 и +3, -2 соответственно. Посчитанное
покрытие
для нескольких лучших выравниваний составляло более 99% (135/136) Высокий процент идентичности и схожести аминокислотных
последовательностей дает возможность говорить о гомологичности данных последовательностей и сохранении одной и той же функции.
С остальными белками ситуация была уже не такая очевидная. Пришлось перебрать несколько других белков, прежде чем найти те, которые имели бы предположительных
гомологов. Например, для белка каспаза-3 (caspase-3), который отвечает за апоптоз в клетках, в данном геноме не нашлось ни одного гомолога. Это можно
объяснить тем, что каспаза более характерна и изучена для животных клеток, а в растительных ее гомологии отсутсвуют (но есть ее аналог). Поэтому, каспаза, наверно, была
неподходящим белком, для того чтобы искать ее в геноме любого эукариота, в частности в геноме
Amoeboaphelidium protococcarum (Поэтому не привожу ее в таблице 4).
Регулятор хромосомной конденсации (RCC1_HUMAN) - фактор высвобождения гуаниновых нуклеотидов, который способствует обмену
Ran-связанного GDP с помощью GTP и тем самым играет важную роль в RAN-опосредованных функциях при ядерном импорте и митозе
(Ran = RAs-related Nuclear protein). С помощью
Pham я нашла в RCC1_HUMAN 7 одинаковых доменов.
Поэтому я думала, что его гомологи гена этого белка должны присутствовать у всех эукариотов, но, видимо, это не так.
Убиквитин-конъюгирующий фермент E2 R1 (UB2R1_HUMAN) принимает убиквитин из комплекса Е1 и катализирует его ковалентное присоединение к другим белкам,
катализирует связанное с Lys-48 полиубиквитинирование. Убиквитин (от англ. ubiquitous — «вездесущий») — небольшой (8,5 кДа) консервативный
белок эукариот, участвующий в регуляции процессов внутриклеточной деградации других белков, а также в модификации их функций.
Он присутствует почти во всех тканях многоклеточных эукариот, а также у одноклеточных эукариотических организмов. Консервативность убиквитина
показалась мне основанием, для того чтобы предположить консервативность связанного с ним фермента. Основываясь на результаты BLAST (Identity 57%), можно
сделать вывод о гомологичности UB2R1_HUMAN и белка, кодируемого одним из геном
Amoeboaphelidium protococcarum, однако нельзя однозначно говорить о сохранении
этими белками одной и той же функции.
После продолжительного поиска контига, в котором был бы какой-нибудь белок, я нашла
контиг
из того же организма
Taeniopygia guttata из прошлого практикума, но из
другой сборки,
в которй не были аннотированы белки.
Результат BLASTX показал, что, скорее всего, в данном контиге содержится кинезин-подобный белок KIF1C, причем лучшая находка была "kinesin-like protein KIF1C [Taeniopygia guttata]"
была из того же организма, что и тот, из генома которого был взят контиг, а большинство других значимых находок принадлежали ддругим птицам.
Про белок KIF1C мало написано на UniProt, но известно что он принимает участие в везикулярном транспорте из аппарата Гольджи в ЭПР, и у него есть микротрубочковый мотор.