Учебный сайт Софроновой Алины
BLAST

        BLAST (англ. Basic Local Alignment Search Tool) — семейство компьютерных программ, служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или её фрагмент.
        Используя BLAST, я искала гомологов для белка сукцинилглутамата десукцинилазы\аспартоацилазы (succinylglutamate desuccinylase/aspartoacylase) из генома бактерии Shewanella frigidimarina NCIMB 400 в базе данных Uniprot/SwissProt. К сожалению, поиск дал только 2 результата, причем с большим значением E-value - 4.6 и 5.4. Достоверным гомологом можно считать белок с E-value < 0.00001. Тогда для поиска гомолога своего белка я решила выбрать более большую базу данных Refseq_protein. Поиск выдал таблицу с находками. Таблица содержит следующие столбцы: Description - описание и название находки, Max score - максимальный вес выравнивания, Total score - общий вес выравнивания, Query cover - процент покрытия заданной последовательности находкой, E value(Expect value) - количество случайных последовательностей с таким же или большим весом выравнивания (в той же базе данных, с теми же параметрами), Ident - процент индентичности находки и заданной последовательности, Accession - индентификатор находки. Исходя из критериев Identity порядка 40-70%, coverage менее 100%, E-value < 0.00001, но и не 0.0, я выбрала белок с тем же названием - сукцинилглутамат десукцинилаза\аспартоацилаза (succinylglutamate desuccinylase/aspartoacylase) из генома другой бактерии Bacteriovorax sp. BAL6_X. В Таблице 1 приведены параметры найденного белка. Участок совпадения с 31 по 364 аминокислоту.

Таблица 1. Параметры находки белка гомолога из базы данных RefSeq.

Description Max score Total score Query cover E-value Ident Accession
succinylglutamate desuccinylase/aspartoacylase family protein [Bacteriovorax sp. BAL6_X] 227 227 87% 5e-67 40% WP_021267013.1

        Более подробное описание находки, а так же выравнивание представлено на Рис.1. Вес находки составляет 578 (227 в битах), E-value - 5e-67, процент совпадения равен 40, процент сходных участков 56.


Рис.1. Параметры находки и ее выравнивание.
Карта локального сходства

        Карта локального сходства - графическое представление расположения выбранных последовательностей относительно друг друга. По оси абцисс координаты моего белка, по оси ординат координаты найденного белка гомолога. Карта сходства представлена на Рис.2.


Рис.2. Карта локального сходства

        По карте видно, что последовательности имеют схожие участки начиная с 31 аминокислоты. Далее участки прерываются. Скорее всего в местах разрыва произошли вставки или делеции. С 232 по 236 аминокислоту (по оси ординат) наблюдаем больший разрыв, что связано с продолжительным участком гэпов в находке с этими координатами. Сходные, но вероятно не гомологичные участки наблюдаются. Начиная с 106 аминокислоты по 145 (по оси абцисс), на карте сходства множество мелких отрезков, сдвинутых друг относительно друга. Если посмотреть на выравнивание в этих местах, можно заметить малое количество абсолютных совпадений, сравнительно небольшое количество схожих остатков (отмечены знаком "+") и множество участков с гэпами. Я считаю, что эти участки схожи, но вероятнее всего не гомологичны.

Гомологи среди других таксонов

        Изменяя параметры BLAST, указывая требуемый таксон в поле Organism, можно отыскать белки-гомологи у организмов другого таксона. В базе данных Uniprot/SwissProt не содержится ни одного белка-гомолога эукариотного организма (поле Organism - Eucaryotae (taxid:2759)) и организма не из того же рода (поле Organism - Not Shewanella). Поэтому я опять же взяла более раширенную базу данных RefSeq. В ней был найден один гомолог для эукариотного организма. Параметры находки представлены на Рис.3.


Рис.3. Параметры находки белка из эукариотного организма.

        Значение E-value маленькое, что свидетельствует о возможной гомологии, но процент индентичности мал - 28%.
        Если искать гомологи среди других родов в базе данных RefSeq, BLAST выдает 1111 находок. Если учесть, что нам необходимо E-value со значением меньше 0.001, количество находок уменьшается до 857. Для первых 12 белков я построила множественное выравнивание. Здесь можно просмотреть последовательности в формате fasta. Результат представлен на Рис.4.

Рис.4. Множественное выравнивание гомологичных белков.Раскраска Clustalx. Консервативность более 50%.
Здесь можно скачать проект с выравниванием.

Вернуться к 2 семестру

© Алина Софронова, 2013
Дата последнего изменения: 28.11.2013