Нуклеотидные банки данных
С помощью SRS был получен список хромосом дрожжей Saccharomyces cerevisiae. Результаты представлены ниже.
REFSEQ_DNA:NC_001133 NC_001133 Saccharomyces cerevisiae S288c chromosome I, complete sequence. 230218 REFSEQ_DNA:NC_001134 NC_001134 Saccharomyces cerevisiae S288c chromosome II, complete sequence. 813184 REFSEQ_DNA:NC_001135 NC_001135 Saccharomyces cerevisiae S288c chromosome III, complete sequence. 316620 REFSEQ_DNA:NC_001136 NC_001136 Saccharomyces cerevisiae S288c chromosome IV, complete sequence. 1531933 REFSEQ_DNA:NC_001137 NC_001137 Saccharomyces cerevisiae S288c chromosome V, complete sequence. 576874 REFSEQ_DNA:NC_001138 NC_001138 Saccharomyces cerevisiae S288c chromosome VI, complete sequence. 270161 REFSEQ_DNA:NC_001139 NC_001139 Saccharomyces cerevisiae S288c chromosome VII, complete sequence. 1090940 REFSEQ_DNA:NC_001140 NC_001140 Saccharomyces cerevisiae S288c chromosome VIII, complete sequence. 562643 REFSEQ_DNA:NC_001141 NC_001141 Saccharomyces cerevisiae S288c chromosome IX, complete sequence. 439888 REFSEQ_DNA:NC_001142 NC_001142 Saccharomyces cerevisiae S288c chromosome X, complete sequence. 745751 REFSEQ_DNA:NC_001143 NC_001143 Saccharomyces cerevisiae S288c chromosome XI, complete sequence. 666816 REFSEQ_DNA:NC_001144 NC_001144 Saccharomyces cerevisiae S288c chromosome XII, complete sequence. 1078177 REFSEQ_DNA:NC_001145 NC_001145 Saccharomyces cerevisiae S288c chromosome XIII, complete sequence. 924431 REFSEQ_DNA:NC_001146 NC_001146 Saccharomyces cerevisiae S288c chromosome XIV, complete sequence. 784333 REFSEQ_DNA:NC_001147 NC_001147 Saccharomyces cerevisiae S288c chromosome XV, complete sequence. 1091291 REFSEQ_DNA:NC_001148 NC_001148 Saccharomyces cerevisiae S288c chromosome XVI, complete sequence. 948066
Информация о хромосоме XII:
Подробная информация о некоторых генах заданной хромосомы:
Ген | Цепь | Число интронов | Координаты CDS |
YLL066W-B | Прямая | 0 | 5605..5775 |
PAU18 | Обратная | 0 | complement(13083..13445) |
RPS0B | Прямая | 1 | join(242232..242321,242681..243349) |
YLL067C | Обратная | 1 | complement(join(585..3915,4015..4301)) |
Получение последовательности, кодирующей белок URHG2_BACSU
Выравнивание белков и их генов
Для работы используем белок URHG2_BACSU и его гомолог URHG1_BACSU. Создадим несколько выравниваний:
URHG2_BACSU 1 MGSMDQSIAVKSPLTYAEALANTIMNTYTVEELPPANRWHYHQGVFLCGV 50 .:.|.:.|....::::............|.:..||...|| URHG1_BACSU 1 ----------MAQLIFDEEKVTSVIDRIVKRTFQMDFAWDWPGGVAFYGV 40 URHG2_BACSU 51 LRLWEATGEKRYFEYAKAYADLLIDDNGNLLFRRDELDAIQAGLILFPLY 100 ...:|||..:.|....|.:.|..::|....| .::.:..|..|..|: URHG1_BACSU 41 AEAYEATENEEYINLLKTWVDEQLEDGLPPL----SINGVSIGHTLLFLH 86 URHG2_BACSU 101 EQTKDERYVK-AAKRLRSLYGTLNRTSEGGFWHKDG-----YPYQMWLDG 144 :.|.|:.|:: ||:....:.....|..||...|... :|.|.|.|. URHG1_BACSU 87 KVTGDDVYLETAAEMAEYVLHKAPRFGEGILQHTVNAAEYVFPEQAWADT 136 URHG2_BACSU 145 LYMGGPFALKYANLKQETELFDQVVLQESLMRKHTKDAKTGLFYHAWDEA 194 |.|.|.|.|:...:.:..:.|:..:.|........:|..|.|:|||||.. URHG1_BACSU 137 LMMAGLFMLRIGRVMEREDYFEDGLRQFHGHEDVLQDPVTNLYYHAWDNK 186 URHG2_BACSU 195 KKMPWANEETGCSPEFWARSIGWYVMSLADMIEELPKKHPNRHVWKNTLQ 244 .: |..:|. :|.|:.||..:::|..:..:...||:..:...:|: URHG1_BACSU 187 AQ----NHLSGI---YWGRANGWAALTMAKALPLIEVTHPSFMIIDGSLR 229 URHG2_BACSU 245 DMIKSICRYQDKETGLWYQIVDKGDRSDNWLESSGSCLYMYAIAKGI-NK 293 |.:.::.|.|| |:|||:.|:|. .|::||.|.|. .||..: :. URHG1_BACSU 230 DQLSALVRLQD-ESGLWHTILDD---PDSYLEVSASA----GIASALMSS 271 URHG2_BACSU 294 GYLDRAYETTLLKAYQGLIQHKTETSEDGAFLVKDICVGTSA-----GFY 338 |.|...|....|.|....:: |||. |..:..||:. |:. URHG1_BACSU 272 GKLYTKYVQKSLAAILDAVE------EDGR--VSRVSAGTAVMKNAEGYK 313 URHG2_BACSU 339 DYYVSRERSTNDLHGAGAFILAMTELEPLFRSAGK--- 373 .....|.:. .|.| ||:|.|..:.::..: URHG1_BACSU 314 QVPYKRIQG----WGQG---LALTFLADVLKTKKRLYQ 344
Поиск в нуклеотидном банке NCBI по имени гена
Для примера используем ген RPS0B из первого упражнения, который находится на прямой цепи двенадцатой хромосомы Saccharomyces cerevisiae. Ищем ген в банке NCBI и получаем 114 результатов. Заметим, что помимо Saccharomyces cerevisiae, данный ген также встречается у других видов дрожжей, например, Vanderwaltozyma polyspora, Tetrapisispora phaffii, Kazachstania africana, Naumovozyma dairenensis. Переходим по первой ссылке, это и есть описание изучаемого гена. Здесь мы можем увидеть подробную информацию о расположении гена, закодированном белке и т.д.