Личный сайт
Просвирова Кирилла

Нуклеотидные банки данных

Для ознакомления с базами данных было предложены найти хромосомы S. cerevisiae с помощью SRS. Инструкция к получению результата: на странице "Select Databanks" отметьте чекбокс "RefSeq_DNA (release)" и нажмите "Standard Query Form". Затем введите нужные значения полей Organism Name (название организма) и Molecule (DNA). Не стоит копировать таблицу непосредственно со страницы с результатом SRS. Сначала поставьте галочки только против тех строк, которые отвечают хромосомам, затем нажмите Save и ещё раз Save. Результаты поиска приведены ниже:
						
REFSEQ_DNA:NC_001133	NC_001133	Saccharomyces cerevisiae S288c chromosome I, complete sequence. 	230218	
REFSEQ_DNA:NC_001134	NC_001134	Saccharomyces cerevisiae S288c chromosome II, complete sequence. 	813184	
REFSEQ_DNA:NC_001135	NC_001135	Saccharomyces cerevisiae S288c chromosome III, complete sequence. 	316620	
REFSEQ_DNA:NC_001136	NC_001136	Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 	1531933	
REFSEQ_DNA:NC_001137	NC_001137	Saccharomyces cerevisiae S288c chromosome V, complete sequence. 	576874	
REFSEQ_DNA:NC_001138	NC_001138	Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 	270161	
REFSEQ_DNA:NC_001139	NC_001139	Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 	1090940	
REFSEQ_DNA:NC_001140	NC_001140	Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 	562643	
REFSEQ_DNA:NC_001141	NC_001141	Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 	439888	
REFSEQ_DNA:NC_001142	NC_001142	Saccharomyces cerevisiae S288c chromosome X, complete sequence. 	745751	
REFSEQ_DNA:NC_001143	NC_001143	Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 	666816	
REFSEQ_DNA:NC_001144	NC_001144	Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 	1078177	
REFSEQ_DNA:NC_001145	NC_001145	Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 	924431	
REFSEQ_DNA:NC_001146	NC_001146	Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 	784333	
REFSEQ_DNA:NC_001147	NC_001147	Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 	1091291	
REFSEQ_DNA:NC_001148	NC_001148	Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 	948066	
Мой номер в списке 30. Поэтому мне досталась хромосома номер 1 + остаток 30\16 = XV.
  • Длина - 1091291 пар оснований.
  • Количество генов белков - 569.
  • Количество генов тРНК - 20.
  • Ген, который находится на прямой цепи и не имеет интронов MET7(786995..788641)
  • Ген, который находится на обратной цепи и не имеет интронов SSP2(complement(<788742..>789857))
  • Ген, который находится на прямой цепи и имеет хотя бы один интронYOR239W (join(784857..785687,785689..786744))
  • Ген, который находится на обратной цепи и имеет хотя бы один интронRPS19A(complement(join(<92026..92440,92831..>92850)))

Получение последовательности, кодирующей заданный белок

Мне был выдан идентификатор RefSeq - NP_223282.1. Далее с помощью приложений на сайт Uniprot были полчены AC и Uniprot ID. AC: IPYR_HELPJ, ID: Q9ZLL5. Список команд:
  • entret uniprot:IPYR_HELPJ - получение записи uniprot
  • entret embl:AAD06146.1 - получение записи в формате embl
  • seqret -sask aad06146.1.entret - получение CDS из файла
Были получены следующие файлы:


Просвиров Кирилл. Дата последнего изменения: 4 октября 2014.

AAD06146.1