EMBL database |
|||||
Задание 1.Знакомство со структурой банка EMBL посредством поисковой системы SRSПри выполнении задания пользуемся SRS на сайте EBI: srs.ebi.ac.ukУпражнение 1. Дата последнего проиндексированного в системе релиза EMBL и количество записей в нём. C "Library Page" следуем по гиперссылке "EMBL (release)". Находим на открывшейся странице запись The current release (113) has 82772678 entries and was indexed 18-Sep-2012.Итого: в последнем релизе от 18/09/2012 года 82772678 записей. Упражнение 2. Список классов ("Data Class") банка EMBL. The various classes of data in the EMBL databanks are represented by three letter codes. A summary of all the codes is shown below:
Упражнение 3. Cписок разделов ("Divisions") банка EMBL. The various taxonomic divisions in the EMBL databanks are represented by three letter codes. A summary of all the codes is shown below:
Задание 2.Описание гена FLOT1 в записи банка EMBL
Задание 3.Нахождение белка по фрагменту гена FLOT1Проводим поиск по самому длинному кодирующему участку 1211088..1211269 (длина 181 п.н.).
На домашней странице BLAST запустим программу blastx, которая сравнивает вероятные продукты трансляции нуклеотидной последовательности с записями в базе данных белковых последовательностей. В поле для ввода последовательности введём полученную последовательность кодирующего участка гена FLOT1. Выберем базу данных UniProtKB/Swiss-Prot(swissprot). БУдем вести поиск по Homo sapiens (human (taxid:9606)). После завершения процесса поиска по последовательности кодирующего участка гена FLOT1 был найден белок: Flottilin-1 (O75955). Как видно из приведённого ниже выравнивания, искомой последовательности кодирующего участка гена соответствует участок 275-301 белка. ![]() Задание 4.Ссылки из записи банка Swiss-Prot на записи банка EMBLМой белок - GUAD_BACSU (O34598). Записи в Swiss-Prot о нем можно найти командой:entret sw:O34598Выходной файл guad_bacsu.entret содержит следущие строки (ссылки на банк EMBL) DR EMBL; AJ002571; CAA05596.1; -; Genomic_DNA. DR EMBL; AL009126; CAB13174.1; -; Genomic_DNA.Записи EMBL, в которых описан ген белка GUAD_BACSU (O34598) ищем через SRS следущим образом:
![]() Как видно из таблицы, в EMBL две записи. Одна - это полный сиквенированный геном бактерии, а другая - фрагмент ДНК между xlyA и ykoR. Полный геном отсеквенировал позднее и размер его, естественно больше. | |||||
Наверх |