Главная
Семестр 1
Семестр 2
Семестр 3
Семестр 4
О себе
Ссылки

Нуклеотидные банки данных

В качестве первого задания нужно было вывести список хромосом дрожжей Saccharomyces cerevisiae, полученный с помощью SRS. В гаплоидном наборе 16 хромосом, ниже приведен список:

REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	
          

Далее надо было описать подробнее хромосому XIV. Для удобства я приведу небольшую таблицу:

Таблица 1. Chromosome XIV.
Поле информации
Расшифровка
Значение
Sequence Length Длина последовательности 784333
CDS Количество кодируемых белков 398
tRNA Количество кодируемых tRNA 14

Следующая таблица для примеров различных генов:

Таблица 2. Примеры генов.
Описание
Название
Координаты
Ген, который находится на прямой цепи и не имеет интронов MFA2 <352414..>352530
Ген, который находится на обратной цепи и не имеет интронов PGA2 complement(<349367..>349756)
Ген, который находится на прямой цепи и имеет хотя бы один интрон YSF3 join(<366033..366035,366158..>366412)
Ген, который находится на обратной цепи и имеет хотя бы один интрон IST1 complement(join(<144280..145149,145255..>145281))

Для второго задания надо было найти AC моего белка из первого семестра в EMBL. Для этого я воспользовалась программой entret на сервере kodomo. Полученный АС: CP000383. C помощью все той же программы я загрузила файл с полной записью генома из EMBL. В ней я нашла свой ген по названию /gene="tfdD", которое я выясняла еще в первом семестре, и его координаты: complement(2486267..2487373). Далее я воспользовалась два раза программой seqret (для создания файла в fasta-формате с записью полного генома и для создания файла в fasta-формате с записью гена моего белка).