Анализ белка и его геномного окружения

Описание Уридилаткиназы из генома бактерии Ureaplasma parvum serovar 3 str. ATCC 700970.

Процесс получения основной информации о белке

На сайте NCBI по выданному идентификатору белка AAF30926.1 была найдена (тип данных: Protein) запись о изучаемом белке. В ней в поле DBSOURCE была найдена ссылка на источник, откуда была получена последовательность. Ссылка перенесла нас на запись полного генома бактерии Ureaplasma parvum serovar 3 str. ATCC 700970. После чего был скачан файл в формате .gb. После его анализа и поиска в нем изучаемого белка была найдена информация, отображенная в таблице 1, и создан файл в формате .fasta с идентификатором, описанием и последовательностью заданного белка.

Таблица 1. Описание Уридилаткиназа из генома бактерии Ureaplasma parvum serovar 3 str. ATCC 700970.
Идентификатор белка AAF30926.1
Идентификатор генома AF222894.1
Название белка Уридилаткиназа
Координаты гена в геноме 634834..635541
Длина гена (п.н) 708
Цепь Обратная
Длина белка (а.о.) 235

С помощью текстового поиска в .gb файле по идентификатору белка были определены его аминокислотная последовательность и его описание. Fasta файл изучаемого белка

По названию белка (киназа) можно предположить, что этот белок играет важную роль в жизни клетки. Катализируя перенос фосфатной группы от молекулы АТФ на различные субстраты, участвуя при этом в различных синтезах и клеточных механизмах. Так же можно отметить, что количество аминокислот соответствует 705 н.о., при этом получается, что оставшиеся три н.о. выполняют роль стоп-кодона.

Геномное окружение белка

С помощью сайта NCBI был открыт геномный браузер генома моей бактерии. После этого по известным координатам моей последовательности было возможно найти изучаемый ген на общей карте. После чего были созданы файлы в форматах .pdf и .png.

Рисунок 1. Геномное окружение гена белка Уридилаткиназа (идентификатор белка AAF30926.1). Изображение получено с помощью геномного браузера NCBI.

По полученному изображению видно, что ген находится на комплиментарной цепочке, в его окружении находятся еще два гена на той же цепочке ДНК. Так же видно, что при сдвиге рамки считывания на -1 остается большая структура, которая по размерам похожа на первоначальный ген. При других сдвигах структура гена полностью пропадает.


Здесь можно будет найти ссылки на:

  1. страницу семестров с описанием выполненных задач
  2. официальный сайт ФББ МГУ