Поиск гомологии
Введение
В данном практикуме было необходимо найти у вероятно родственных белков консервативные блоки для доказания их гомологичности. Для этого в сервисе pBLAST были найдены гомологичные белки и взяты первые двадцать находок. Их последовательности были скачены, а после этого в программе Jalview было проведено множественное выравнивание. После удаления сильно различающихся последовательностей было оставлено девять белков.
Выбранный белок (NCAM-1) - невральная молекула межклеточной адгезии человека. Оставшиеся после удаления лишних последовательности оказались вариантами этого белка у различных организмов, таких как мыши (Mus musculus), крысы (Rattus norvegicus), быка (Bos taurus), курицы (Gallus gallus), лягушки (Xenopus laevis) и, конечно, человека (Homo sapiens).
Результаты
В полученном выравнивании было найдено семь участков с большим количеством консервативных позиций, при этом помимо них в белке много "одиночных" консервативных колонок. Из всего этого можно заключть, что белки гомологичны.
Ссылка на проект JalviewSource | Domain | Start | End |
---|---|---|---|
sig_p | n/a | 1 | 19 |
Pfam | I-set | 20 | 114 |
Pfam | Ig_3 | 119 | 192 |
Pfam | I-set | 214 | 304 |
disorder | n/a | 245 | 253 |
low_complexity | n/a | 251 | 260 |
disorder | n/a | 256 | 262 |
Pfam | Ig_3 | 307 | 399 |
disorder | n/a | 323 | 327 |
disorder | n/a | 340 | 344 |
disorder | n/a | 349 | 363 |
disorder | n/a | 367 | 368 |
Pfam | I-set | 418 | 505 |
Pfam | fn3 | 508 | 598 |
disorder | n/a | 514 | 529 |
disorder | n/a | 600 | 621 |
Pfam | fn3 | 610 | 696 |
disorder | n/a | 628 | 630 |
disorder | n/a | 632 | 633 |
disorder | n/a | 710 | 713 |
transmembrane | n/a | 723 | 746 |
low_complexity | n/a | 723 | 738 |
disorder | n/a | 766 | 767 |
disorder | n/a | 770 | 858 |
low_complexity | n/a | 806 | 818 |
Информация о доменах
После определения консервативных блоков мне стало интересно, каким доменам они могут принадлежать. На сайте Pfam была найдена архитектрура белка NCAM1 человека (P13591) и координаты доменов. Поиск в Pfam показал, что в белке чередуются несколько доменов иммуноглобулина (Immunoglobulin I-set domain (3 шт) и Immunoglobulin domain (2 шт)), а в конце есть два домена фибронектина (Fibronectin type III domain). Оказалось, что выделенные мной участки - это только части доменов. Так, первые два блока соотвестствуют началу и концу первого домена иммунаглобулина, третий блок - окончание другого домена иммуноглобулина. Интересно, что самый длинный найденный мной консервативный блок (784-830), если верить Pfam, не принадлежит ни одному домену. Возможно, это ещё не описанный домен, либо просто участок без особых специальных функций, в котором по какой-то причине редко происходили мутации. Таблица с координатами доменов была скопирована с сайта Pfam и представлена слева.