Нуклеотидный BLAST


Задание 1. Определение функции и таксономии нуклеотидной последовательности

Был взят контиг из 6 практикума. Для выравнивания был выбран blastn, так как нужно найти последовательность, похожую на исходную. При запуске blastn использовались стандартные значения параметров.

Судя по выдаче blast данная последовательность принадлежит Eubranchus rupium (высокий процент перекрытия и идентичности). Скорее всего эта последовательность кодирует цитохром С оксидазу.

Eubranchus rupium - это морской брюхоногий моллюск, обитающий в северной части Атлантического океана.




Задание 2. Поиск генов белков в неаннотированной нуклеотидной последовательности

В качестве источника нуклеотидной поледовательности был выбран контиг сборки Melopsittacus undulatus длиной 52 900 пн.

Для анализа закодированного белка была выбрана программа blastx, так как необходимо перевести последовательность нуклеотидов в последовательность аминокислот. (Swissprot). Парамеры поиска:

Database: Swissprot; Organism: exclude Melopsittacus undulatus (taxid:13146); Expected threshold: 0.05; Matrix: BLOSUM62; Gap Costs: Existence: 11 Extension: 1; Word size: 6

Выдача BLAST

Судя по выдаче можно предположить, что в выбранный контиг попали два гена. Наибольшее сходство наблюдается с белком CIP2A - это онкопротеин, блокирует опухоль-супрессивное действие комплекса протеинфосфатазы 2А (РР2А) и усиливает злокачественность, способствует образованию опухолей. Используется как онкомаркер.

Процент идентичности составляет 77-87%, данный белок найден у курицы и человека - эволюционно довольно близкие организмы к волнистому попугаю (на уровне класса) и у лягушки - несильно родственный организм. Протеинфосфатазы - это группа ферментов, отвечающих за удаление фосфатной группы у белка-субстрата. Процессы фосфорилирования и дефосфорилирования различных субстратов являются одними из важнейших и частовстречаемых биохимических реакций, так что наличие белка ингибитора дефосфорелирования у столь разных организмов, включая волнистого попугая, вполне вероятно.

Чуть меньший процент сходства с рибосомальной оксигеназой 2, которая участвует в биогенезе рибосом, она приводит к увеличению экспрессии рРНК. Рибосомы в целом встречаются в любой клетке, а среди найденных гомологов найдены белки Млекопитающих, что опять же говорит о вполне вероятном наличии такого белка у волнистого попугая и, исходя из высокого процента идентичности, ген этого белка возможно входит в контиг.



Задание 3. Интепретация карты локального сходства

Для построения карты локального сходства были выбраны два вида бактерий рода Streptomyces : Streptomyces rimosus и Streptomyces calvus - актиномицеты, S.rimosus используется в качестве продуцента антибиотиков.

Геном каждой бактерии полностью расшифрован и состоит из одной хромосомы. С помощью blastn было проведено выравнивание, ниже представлена карта локального сходства или dot plot.


Хромосомы довольно схожи, но на участке 2.9 - 4.2 Mb наблюдается инверсия. На участке 3,25 - 3,5 Mb последовательность принимает исходную ориентацию. Возможно произошла "двойная" инверсия - инверсия участка 3,25 - 3,5 Mb внутри более крупного уже инверсированного участка 2,9 - 4,2 Mb. На участке 5.2 - 5.6 произошла делеция.

Отрицательный наклон прямой говорит о том, что последовательность записана в обратном порядке.