Гомология и выравнивание

Выбор семейства доменов из Pfam для анализа

Для выбора семейства я воспользовался таблицей со списком доменов. Мой выбор пал на домен PF00078, т.к. он подходит по всем критериям.

table1
Таблица. 1. Данные семейства PF00078.

Обратная транскриптаза - это фермент, используемый для получения комплементарной ДНК из РНК-шаблона, процесс, называемый обратной транскрипцией. Обратные транскриптазы используются вирусами, такими как ВИЧ и гепатит В, для репликации своих геномов, мобильными генетическими элементами ретротранспозонов - для размножения в геноме хозяина, а эукариотическими клетками - для удлинения теломер на концах линейных хромосом. Вопреки широко распространенному мнению, этот процесс не нарушает потоков генетической информации, описанных классической центральной догмой, поскольку перенос информации от РНК к ДНК явно возможен.

Выравнивание seed с точки зрения гомологичности всех последовательностей или их подмножества

Мое выравнивание имеет 69 последовательностей и 300 колонок. В выравнивании блоков я не обнаружил, зато были отдельные консервативные колонки. 100% консервативные колонки в МДБ-all: 159,205, 253. Максимальный достоверный блок МДБ-notAll: 187-205. 100% консервативные колонки в МДБ-notAll: 2-4, 21, 30, 32-36, 39-41, 49-53, 70-72, 187-203, 252-258.

Участок выравнивания, в котором нет никаких достоверных подблоков, и потому маловероятно, что выравнивание на этом участке отражает ход эволюции: 203-210, 213-218, 227-234, 263-267, 280-287.

Fasta файл выравнивания всех последовательностей
Выравнивание отдельных последовательностей notAll.jvp

Карта локального сходства двух последовательностей (dotplot)

dotplot
Рисунок. 1. Dotplot.

Для выполнения этого задания я выбрал домены PF00077 - PF00078 и PF00077 - PF00078 - PF06817. AC организмов: Q87115 и O36552 соответственно.
На карте нет разрывов, это соответствует о том, что выравнивания не имеют инделей.