Главная | Семестры | Проекты | Обo мне | Ссылки | Заметки | Назад к оглавлению |
Нуклеотидные банки данны
1. Знакомство со структурой банка RefSeq посредством поисковой системы SRS
Cписок хромосом дрожжей Saccharomyces cerevisiae
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
Информация о III хромосоме:
Длина | Количество генов | Количество тРНК |
316620 | 177 | 10 |
Примеры некоторых генов (gene=название гена + кодируемый продукт):
какой ген | ген, на + цепи без интронов | ген, на - цепи без интронов | ген, на + цепи с интроном(ми) | ген, на - цепи с интроном(ми) |
gene= | VBA3 VBA3p | HMLALPHA2 HMLALPHA2p | VMA9 VMA9p | YCL002C hypothetical protein |
Gene ID | 850290 | 850292 | 2732686 | 850353 |
CDS | 9706..11082 | complement(12386..13018) | join(107023..107033,107111..107191,107288..107417) | complement(join(110808..111557,111634..111675)) |
2. Получение последовательности, кодирующей белок PDAA_BACSU
- Получим АС белка в EMBL с помощью программы entret sw:PDAA_BACSU - D8396
- Определим границы кодирующего участка с помощью команды entret embl:D8396 - 62..847
- Командной seqret -sask вырежем нужный фрагмент и получим файл
3. Выравнивание белков и их генов
Для выравнивания будем использовать PDAA_BACSU и гомологичный ему B9IXV4_BACCQ:
выравнивание последовательностей белков программой needle
выравнивание последовательностей их генов программой needle
выравнивание последовательностей их генов программой tranalign