Банк нуклеотидных последовательностей EMBL

Задание 1

a) Последний проиндексированный релиз EMBL состоялся 5 сентября 2008 года и содержит 92831733 записей.

b) Результаты представлены в виде таблицы
  • ANN: Constructed sequence with annotation
  • CON: Constructed sequence
  • EST: Expressed Sequence Tag
  • GRV: Genome Reviews
  • GSS: Genome Survey Sequence
  • HTC: High Throughput cDNA sequencing
  • HTG: High Throughput Genome sequencing
  • MGA: Mass Genome Annotation
  • PAT: Patent
  • SET: Project set (EMBL WGS Masters only)
  • STD: Standard
  • STS: Sequence Tagged Site
  • TPA: Third Party Annotation
  • TSA: Transcriptome Shotgun Assembly
  • WGS: Whole Genome Shotgun
  • класс не проиндексирован
  • класс не проиндексирован
  • 54868004 записей
  • класс не проиндексирован
  • 24420981 записей
  • 524114 записей
  • 135664 записей
  • класс не проиндексирован
  • 6175434 записей
  • класс не проиндексирован
  • 5752704 записей
  • 945908 записей
  • 5919 записей
  • 3005 записей
  • класс не проиндексирован

c) Cписок разделов банка EMBL.
  • ENV: Образцы из окружающей среды
  • FUN: Грибы
  • HUM: Человек
  • INV: Беспозвоночные
  • MAM: Другие млекопитающие
  • MUS: Домовая мышь
  • PHG: Бактериофаги
  • PLN: Растения
  • PRO: Прокариоты
  • ROD: Грызуны
  • SYN: Синтетические
  • TGN: Трансгенные
  • UNC: Неклассифицированные
  • VRL: Вирусы
  • VRT: Другие позвоночные
  • 3614899 записей
  • 2524681 записей
  • 11540219 записей
  • 13679938 записей
  • 8686059 записей
  • 7330487 записей
  • 4896 записей
  • 28334269 записей
  • 675972 записей
  • 1804253 записей
  • 1500620 записей
  • 265445 записей
  • 2956530 записей
  • 624900 записей
  • 9288565 записей

d) Я выбрал разделы HUM, ROD, PLN

Разделы человека (HUM) и растений (PLN) в мае 2008 года пополнились значительно сильнее, чем в 2007. Это, особенно в случае человека, скорее всего связано с расшифровкой геномов. Раздел грызунов (ROD) пополнился почти одинаково в 2007 и 2008.

Задание 2

Направление гена относительно направления, выбранного для записи: прямое; Число кодирующих участков: 3;
Длина первого кодирующего участка: 52;
Длина последнего кодирующего участка: 215;
Длина первого интрона: 1424;
Длина последнего интрона: 782.

Задание 3

Для выполнения задания 3 нужно выполнить следующую последовательность действий:
1) Вырезать самый длинный участок с помощью команды seqret -sask
2) Запустить BLAST (blastx) по swissprot, используя бактериальный генетический код
3) Выбрать белок с меньшим e-value В моем случае такой белок - Lymphocyte antigen 6 complex locus protein G6c (ид sw: O95867)
Выравнивание

Score = 130 bits (326), Expect = 2e-30 Identities = 57/57 (100%), Positives = 57/57 (100%), Gaps = 0/57 (0%) Frame = +3 Query 3 KMWVFSNLRCGTPEEPCQEAFNQTNRKLGLTYNTTCCNKDNCNSAGPRPTPALGLVF 173 KMWVFSNLRCGTPEEPCQEAFNQTNRKLGLTYNTTCCNKDNCNSAGPRPTPALGLVF Sbjct 56 KMWVFSNLRCGTPEEPCQEAFNQTNRKLGLTYNTTCCNKDNCNSAGPRPTPALGLVF 112

Задание 4

Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
документа
Описание Длина последовательности
M29378 genomic DNA STD PRO 19-APR-1990 E.coli leucine-specific binding protein (livK) gene, 5' end. 1107
J05516 genomic DNA STD PRO 09-AUG-1990 E.coli leucine-specific transport (LS-BP; LIV-BP) system (livHMGF) genes, complete cds. 8703
U00039 genomic DNA STD PRO 02-JUN-1994 E. coli chromosomal region from 76.0 to 81.5 minutes. 225419
U00096 genomic DNA STD PRO      
AP009048 genomic DNA STD PRO      
V00301 genomic DNA STD PRO 09-JUN-1982 E. coli livK gene. 152
Nota Bene: AP009048 и U00096 EMBL отказывался грузить и выдавал ошибку, поэтому поля не заполнены. Вид ошибки:
         
Error Information
Error: in _fetch()
Главная страница
Второй семестр
Первый семестр

©Арутюнов Артём

©Photo exclusiely made by myself :)

©Я в контакте