Банк нуклеотидных последовательностей EMBL |
1.a. Текущий релиз был проиндексирован 5 декабря 2008 года и содержит 97659985 записей. |
1.b. Информация о классах EMBL |
ANN |
Constructed sequence with annotation |
Записи этого класса не проиндексированы |
CON |
Constructed sequence |
Записи этого класса не проиндексированы |
EST |
Expressed Sequence Tag |
58422143 |
GRV |
Genome Reviews |
Записи этого класса не проиндексированы |
GSS |
Genome Survey Sequence |
24604053 |
HTC |
High Throughput cDNA sequencing |
531057 |
HTG |
High Throughput Genome sequencing |
138136 |
MGA |
Mass Genome Annotation |
Записи этого класса не проиндексированы |
PAT |
Patent |
6557610 |
SET |
Project set (EMBL WGS Masters only) |
Записи этого класса не проиндексированы |
STD |
Standard |
6098682 |
STS |
Sequence Tagged Site |
1299097 |
TPA |
Third Party Annotation |
6012 |
TSA |
Transcriptome Shotgun Assembly |
3195 |
WGS |
Whole Genome Shotgun |
Записи этого класса не проиндексированы |
|
1.c. Информация о разделах EMBL |
ENV |
Образцы из окружающей среды |
3675528 |
FUN |
Грибы |
2645486 |
HUM |
Человек |
11699686 |
INV |
Беспозвоночные |
13983439 |
MAM |
Другие млекопитающие |
9074969 |
MUS |
Мышь домовая |
7338348 |
PHG |
Бактериофаги |
4998 |
PLN |
Растения |
31241789 |
PRO |
Прокариоты |
739235 |
ROD |
Грызуны |
1920985 |
SYN |
Синтетические |
1613314 |
TGN |
Трансгенетические |
265449 |
UNC |
Непроклассифицированные |
3004383 |
VRL |
Вирусы |
652031 |
VRT |
Другие позвоночные |
9800345 |
|
2.Описание гена NG22 в записи BA000025 банка EMBL
Направление гена относительно направления, выбранного для записи: прямое;
Число кодирующих участков: 21;
Длина первого кодирующего участка: 40;
Длина последнего кодирующего участка: 122;
Длина первого интрона: 1858;
Длина последнего интрона: 903. |
3.Для того, чтобы вырезать участок нуклеотидной последовательности в отдельный файл необходимо:
- Подключиться к машине с установленным пакетом EMBOSS
- В случае ОС Linux команда будет выглядеть следующим образом: #seqret -sequence Seq_Name -sask
- Seq_Name в данном случае - BA000025.embl;
- Begin at position [start] - номер позиции, с которой начинается неоходимый участок - 80083;
- End at position [end] - номер позиции, на которой заканчивается необходимый участок - 800412;
- Reverse strand - комплементарня цепь(Y or N), в данном случае N;
- Output sequence(s) - выходной файл - NG22_l.fasta.
Для того, чтобы найти в Swiss-Prot соответствующий белок необходимо:
- Зайти на страницу http://blast.ncbi.nlm.nih.gov/"
- Перейти по ссылке BlastX (ищет белки по заданной нуклеотидной последовательности)
- Одним из нескольких возможных способов подать на вход последовательность выходного файла полученного ранее и нажать
Результат работы:
Нашлось несколько белков. Самый первый результат имеет белок CTL4 с идентефикатором Q53GD3.1 : E-value 3e-16. Данный белок выделен из человека. Исследуемый участок кодирует с 672 по 710 аминокислоты. |
4.Описание всех ссылок на банк EMBL из записи P0A6I3 банка Swiss-Prot. |
Идентификатор записи EMBL
|
Тип молекулы
|
Класс
|
Раздел
|
Длина последовательности
|
Дата создания
|
Описание
|
AP009048
|
genomic DNA
|
STD
|
PRO
|
4646332
|
22-JAN-2006
|
Escherichia coli str. K12 substr. W3110 DNA, complete genome.
|
M36321
|
genomic DNA
|
STD
|
PRO
|
1490
|
11-AUG-1990
|
Escherichia coli rts gene, complete cds.
|
M90071
|
genomic DNA
|
STD
|
PRO
|
1540
|
27-MAR-1992
|
Escherichia coli pantothenate kinase (coaA) gene, complete cds.
|
U00006
|
genomic DNA
|
STD
|
PRO
|
176195
|
22-SEP-1993
|
E. coli chromosomal region from 89.2 to 92.8 minutes.
|
U00096
|
genomic DNA
|
STD
|
PRO
|
4639675
|
23-FEB-2006
|
Escherichia coli str. K-12 substr. MG1655, complete genome.
|
Выводы:
Во всех рассмотренные записях тип молекулы одинаковый. Записи относятся к одному классу данных и находятся в одном разделе EMBL. Удивлят временной разброс записей 1990-2006. Описание уточнялись, в основном, информацией о штамме бактерии и области секвенирования. Длина последовательностей в двух последних записях (2006 года) самая большая, так как там представлены полные геномы Escherichia coli.
|
|
|