EMBOSS


Программа getorf пакета EMBOSS

Был создан файл с записью D89965 банка EMBL при помощи команды entret. Запустила программу getorf так, чтобы получить набор трансляций всех открытых рамок данной последовательности, которые определены при использовании стандартного кода и одновременно удовлетворяют следующим условиям: Для этого была использована команда:
getorf d89965.entret -minsize 90 -find 1
Был получен следующий результат:
MQFHPRLPAVLQVCAACDRYASLLPAQRRL
>D89965_1 [66 - 155] Rattus norvegicus mRNA for RSS, complete cds.
MQFHPRLPAVLQVCAACDRYASLLPAQRRL
>D89965_2 [56 - 169] Rattus norvegicus mRNA for RSS, complete cds.
MISDAVSSATASSASSLRSMRSVRQSFASSTAALTRWP
>D89965_3 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds.
MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM
AVTAYAYYSCHELTPWLRIQSTNPVQKYGA
>D89965_4 [218 - 3] (REVERSE SENSE) Rattus norvegicus mRNA for RSS, complete cds.
MLLRCSNCLNVNWKCIRAIWSKPPLSWQKTGVPIACCANLKHCWQSRMKLHRLSSPVTVT
WCSQKTILLLSA
>D89965_5 [294 - 1] (REVERSE SENSE) Rattus norvegicus mRNA for RSS, complete cds.
MKGNVKKVRRLYNDKVIAGFAGGTADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDR
MLRKLEALLAVADETASLIITGNGDVVQPENDLIAIGS
CDS в транслированном виде выглядит следующим образом:
FT                   /translation="MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHY
FT                   GIAQRGLTITSDDHMAVTAYAYYSCHELTPWLRIQSTNPVQKYGA"
Наиболее всего на CDS с координатами 163..435 похожа запись:
>D89965_3 [163 - 432] Rattus norvegicus mRNA for RSS, complete cds.
MALMHFQFTFKQFEQRKSIRSTARKARDDFVVVQTADLFHVAFHYGIAQRGLTITSDDHM
AVTAYAYYSCHELTPWLRIQSTNPVQKYGA
Последовательность, к которой относится запись D89965 - P0A7B8:
>P0A7B8
MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGGTADAFTLFEL
FERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVADETASLIITGNGDVVQPENDL
AIGSGGPYAQAAARALLENTELSAREIAEKALDIAGDICIYTNHFHTIEELSYKA
Она выравнивается с пятой найденной последовательностью:
P0A7B8             1 MTTIVSVRRNGHVVIAGDGQATLGNTVMKGNVKKVRRLYNDKVIAGFAGG     50
                                                |||||||||||||||||||||||
D89965_5           1 ---------------------------MKGNVKKVRRLYNDKVIAGFAGG     23

P0A7B8            51 TADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVAD    100
                     ||||||||||||||||||||||||||||||||||||||||||||||||||
D89965_5          24 TADAFTLFELFERKLEMHQGHLVKAAVELAKDWRTDRMLRKLEALLAVAD     73

P0A7B8           101 ETASLIITGNGDVVQPENDLIAIGSGGPYAQAAARALLENTELSAREIAE    150
                     |||||||||||||||||||||||||                         
D89965_5          74 ETASLIITGNGDVVQPENDLIAIGS-------------------------     98

P0A7B8            151 KALDIAGDICIYTNHFHTIEELSYKA    176
                                               
D89965_5           98 --------------------------     98

Выводы:

Файлы-списки

Выполненные команды, для получения файла.

EnsEMBL

Был проведен поиск информации о гене человека NEK2_HUMAN (AC в Swiss-Prot: P51955), выбранном ранее.
Попытка найти последовательность гена этого белка, используя сервис "BLAST/BLAT", оказалось неудачной. Вместо выдачи была получена вот такая страница:
Рисунок 1. Выдача BLAST/BLAT.

Cо страницы, посвященной гену была открыта страница Region in detail. Некоторая информация раздела выдачи Region in detail (Рис. 2-5):
Рисунок 2. Расположение гена NEK2 в хромосоме 1.

На рисунке 3 представлен "регион", в котором расположен данный ген.
Рисунок 3. Ген NEK2 в хромосоме 1 и его окружение.

Рисунок 4. Выровненные гены NEK2 из разных баз.
Серым обозначены гены, кодирующие РНК; синим - транскрипты, прошедшие процессинг.

Рисунок 5. Cхема расположения интронов и экзонов в гене NEK2 по различным данным.
Красным показаны гены, кодирующие белки; синим - транскрипты, прошедшие процессинг.

Кроме выдачи Region in detail есть и другие разделы в EnsEMBL. Например, в разделе "Chromosome summary" можно найти информацию о генах в разных участках хромосомы в целом; в разделе "Whole genome" есть информация о всем геноме.



© Novikova Maria, 2013
Последнее обновление: 17.12.2013