Банк нуклеотидных последовательностей EMBL
Задание 1
a) Последний проиндексированный релиз EMBL состоялся 5 сентября 2008 года и содержит 92831733 записей.
b) Результаты представлены в виде таблицы
- ANN: Constructed sequence with annotation
- CON: Constructed sequence
- EST: Expressed Sequence Tag
- GRV: Genome Reviews
- GSS: Genome Survey Sequence
- HTC: High Throughput cDNA sequencing
- HTG: High Throughput Genome sequencing
- MGA: Mass Genome Annotation
- PAT: Patent
- SET: Project set (EMBL WGS Masters only)
- STD: Standard
- STS: Sequence Tagged Site
- TPA: Third Party Annotation
- TSA: Transcriptome Shotgun Assembly
- WGS: Whole Genome Shotgun
|
- класс не проиндексирован
- класс не проиндексирован
- 54868004 записей
- класс не проиндексирован
- 24420981 записей
- 524114 записей
- 135664 записей
- класс не проиндексирован
- 6175434 записей
- класс не проиндексирован
- 5752704 записей
- 945908 записей
- 5919 записей
- 3005 записей
- класс не проиндексирован
|
|
c) Cписок разделов банка EMBL.
- ENV: Образцы из окружающей среды
- FUN: Грибы
- HUM: Человек
- INV: Беспозвоночные
- MAM: Другие млекопитающие
- MUS: Домовая мышь
- PHG: Бактериофаги
- PLN: Растения
- PRO: Прокариоты
- ROD: Грызуны
- SYN: Синтетические
- TGN: Трансгенные
- UNC: Неклассифицированные
- VRL: Вирусы
- VRT: Другие позвоночные
|
- 3614899 записей
- 2524681 записей
- 11540219 записей
- 13679938 записей
- 8686059 записей
- 7330487 записей
- 4896 записей
- 28334269 записей
- 675972 записей
- 1804253 записей
- 1500620 записей
- 265445 записей
- 2956530 записей
- 624900 записей
- 9288565 записей
|
|
d) Я выбрал разделы HUM, ROD, PLN
Разделы человека (HUM) и растений (PLN) в мае 2008 года пополнились значительно сильнее, чем в 2007. Это, особенно в случае человека, скорее всего связано с расшифровкой геномов. Раздел грызунов (ROD) пополнился почти одинаково в 2007 и 2008.
Задание 2
Направление гена относительно направления, выбранного для записи: прямое;
Число кодирующих участков: 3;
Длина первого кодирующего участка: 52;
Длина последнего кодирующего участка: 215;
Длина первого интрона: 1424;
Длина последнего интрона: 782.
Задание 3
Для выполнения задания 3 нужно выполнить следующую последовательность действий:
1) Вырезать самый длинный участок с помощью команды seqret -sask
2) Запустить BLAST (blastx) по swissprot, используя бактериальный генетический код
3) Выбрать белок с меньшим e-value
В моем случае такой белок - Lymphocyte antigen 6 complex locus protein G6c (ид sw: O95867)
Выравнивание
Score = 130 bits (326), Expect = 2e-30
Identities = 57/57 (100%), Positives = 57/57 (100%), Gaps = 0/57 (0%)
Frame = +3
Query 3 KMWVFSNLRCGTPEEPCQEAFNQTNRKLGLTYNTTCCNKDNCNSAGPRPTPALGLVF 173
KMWVFSNLRCGTPEEPCQEAFNQTNRKLGLTYNTTCCNKDNCNSAGPRPTPALGLVF
Sbjct 56 KMWVFSNLRCGTPEEPCQEAFNQTNRKLGLTYNTTCCNKDNCNSAGPRPTPALGLVF 112
Задание 4
Идентификатор записи EMBL
|
Тип молекулы
|
Класс данных
|
Раздел EMBL
|
Дата создания
документа |
Описание
|
Длина последовательности
|
M29378 |
genomic DNA |
STD |
PRO |
19-APR-1990 |
E.coli leucine-specific binding protein (livK) gene, 5' end. |
1107 |
J05516 |
genomic DNA |
STD |
PRO |
09-AUG-1990 |
E.coli leucine-specific transport (LS-BP; LIV-BP) system (livHMGF) genes, complete cds. |
8703 |
U00039 |
genomic DNA |
STD |
PRO |
02-JUN-1994 |
E. coli chromosomal region from 76.0 to 81.5 minutes. |
225419 |
U00096 |
genomic DNA |
STD |
PRO |
|
|
|
AP009048 |
genomic DNA |
STD |
PRO |
|
|
|
V00301 |
genomic DNA |
STD |
PRO |
09-JUN-1982 |
E. coli livK gene. |
152 |
Nota Bene: AP009048 и U00096 EMBL отказывался грузить и выдавал ошибку, поэтому поля не заполнены. Вид ошибки:
Error Information
Error: in _fetch()
©Арутюнов Артём
©Photo exclusiely made by myself :)
©Я в контакте