Главная Семестры Проекты Обо мне

Банк EMBL

1.Знакомство со структурой банка EMBL посредством поисковой системы SRS

Дата последнего (на 11.10.2012) проиндексированного в системе релиза EMBL: 18.09.2012
Количество записей в нём: 82772678

Cписок классов ("Data Class")
банка EMBL
Список разделов ("Divisions")
банка EMBL
CON Constructed sequence --- ENV Environmental Samples 7762556 Пробы окружающей среды Анализы проб, взятые
из окружающей среды в целях
осуществления широкого
экологического наблюдения.
EST Expressed Sequence Tag --- FUN Fungi 2402829 Грибы Царство живой природы,
объединяющее эукариотические организмы,
сочетающие в себе некоторые признаки,
как растений, так и животных.
GRV Genome Reviews --- HUM Human 11304977 Человек Род Люди (Homo) из семейства гоминид
в отряде приматов, единственный
живущий в настоящее время.
GSS Genome Survey Sequence 34528104 INV Invertebrates 7398340 Беспозвоночные В современной систематике эта
группа не признается за полноправный
таксон, в неё попали все животные,
не имеющие позвоночника.
HTC High Throughput cDNA sequencing 491770 MAM Other Mammals 6741732 Другие млекопитающие
(имеется ввиду без человека, грызунов)
Млекопитающие - класс позвоночных животных,
основными отличительными особенностями
которых являются живорождение (за исключением
инфракласса клоачных) и вскармливание детёнышей
молоком (подрастая, постепенно переходят с
молока на твёрдую пищу).
HTG High Throughput Genome sequencing 152599 MUS Mus musculus 5163724 Домовая мышь Вид грызунов рода домовых мышей.
Благодаря своей способности к сосуществованию
с человеком домовые мыши распространились по
всему миру и являются одним из самых
многочисленных видов млекопитающих.
MGA Mass Genome Annotation --- PHG Bacteriophage 8503 Бактериофаги Вирусы, избирательно поражающие
бактериальные клетки. Как правило, бактериофаг
состоит из белковой оболочки и генетического
материала одноцепочечной или двуцепочечной
нуклеиновой кислоты (ДНК или, реже, РНК).
Размер частиц приблизительно от 20 до 200 нм.
PAT Patent 24364832 PLN Plants 20284404 Растения Одна из основных групп многоклеточных
организмов, включающая в себя в том
числе мхи, папоротники, хвощи, плауны,
голосеменные и цветковые растения.
SET Project set (EMBL WGS Masters only) --- PRO Prokaryotes 1639517 Прокариоты Одноклеточные живые организмы,
не обладающие (в отличие от эукариот)
оформленным клеточным ядром и другими
внутренними мембранными органоидами.
STD Standard 13920617 ROD Rodents 1313761 Грызуны Самый многочисленный отряд млекопитающих.
Отличительным признаком грызунов
является наличие диастемы и одной
пары крупных резцов в верхней и
нижней челюстях.
STS Sequence Tagged Site 1322570 SYN Synthetic 4045013 Синтетические В последнее время термин
используется в значении, сигнализируя
о новой области исследования, которая
объединяет науку и инженерию с целью
проектирования и построения новых
(несуществующих в природе) биологических
функций и систем.
TSA Transcriptome Shotgun Assembly 7992186 TGN Transgenic 285306 Трансгенные Трансген - фрагмент ДНК, переносимый при
помощи генно-инженерных манипуляций
в геном определённого организма с
целью модификации его свойств.
WGS Whole Genome Shotgun --- UNC Unclassified 8617170 Неклассифицированные То, что не вошло по каким-либо
критериям в любой из имеющихся
классов.
VRL Viruses 1358516 Вирусы Субклеточный инфекционный агент,
который может воспроизводиться только
внутри живых клеток организма. Вирусы
представляют собой микроскопические
частицы, состоящие из молекул нуклеиновых
кислот — ДНК или РНК (некоторые, например
мимивирусы, имеют оба типа молекул),
заключённые в белковую оболочку,
способные инфицировать живые организмы.
VRT Other Vertebrates 4446330 Остальные позвоночные
(имеется ввиду не считая млекопитающих)
Bысший подтип хордовых. Среди позвоночных
нет видов, ведущих сидячий (прикрепленный) образ жизни. Они перемещаются в широких
пределах, активно разыскивая и захватывая
пищу, находя для размножения особей другого
пола, спасаясь от преследования врагов.
(---) - означает, что записи этих классов не проиндексированы в SRS.


2.Описание гена в записи банка EMBL

а) Направление гена относительно направления, выбранного для записи, прямое.
б) Число кодирующих участков - 13
в) Длина первого кодирующего участка - 173; Последнего - 137
г) Длина первого интрона между кодирующими участками - 423; Последнего - 261


3.Нахождение белка по фрагменту гена

Вырезала самый длинный кодирующий участок данного мне гена (TFIIH): 1028111..1028283 (173 нуклеотида).
Для того, чтобы вырезать кодирующий участок в отдельный файл использовала программу seqret.

На странице http://blast.ncbi.nlm.nih.gov/ выбрала программу blastx, так как данная программа ищет в базе данных белки с помощью перевода нуклеотидной последовательности в запрос, а так как мы имеем последовательность гена, нам выгодно выбрать данную программу.
Краткую "инструкцию", как выполнять подобный поиск, можно увидеть тут.

Результатом моего поиска является белок General transcription factor IIH subunit 4 (идентичность 100%). Участок 407 - 462 найденного белка соответствует данному экзону.


4.Ссылки из записи банка Swiss-Prot на записи банка EMBL

Работала с данным мне белком: ENGB_BACSU (P38424).
Запись Swiss-Prot получила программой entret (entret sw:p38424).

Ссылки на EMBL:


C помощью SRS (поиск выглядел таким образом: (([embl-AccNumber:X76424*] | [embl-AccNumber:Z75208*]) | [embl-AccNumber:AL009126*]) ) получила информацию,
необходимую для заполнения таблицы.

Таблица. Записи EMBL, в которых описан ген белка ENGB_BACSU.
ID записи Тип молекулы Класс данных Дата внесения в банк Описание Длина последовательности
AL009126 genomic DNA STD 18-июля-2002 Bacillus subtilis subsp. subtilis str. 168 complete genome. 4215606
X76424 genomic DNA STD 01-июня-1994 B.subtilis lon gene for protease La 3999
Z75208 genomic DNA STD 08-января-1997 B.subtilis genomic sequence 89009bp 89009


©Melnichuk Anastasia