Практикум 7. Нуклеотидные банки данных
Выбор сборки генома эукариотического организма.
Изначально я хотела взять Желтобрюхую жерлянку (yellow-bellied toad, Bombina variegata), но к сожалению для нее не оказалось файла с белковыми последовательностями. Поэтому я просто оставлю здесь ее описание:
Жерлянки маленькие бесхвостые земноводные, взрослые особи не больше 5 см в длину. Их отличает ярко желтая с черно-серыми пятнами окраска брюха. Узор пятен индивидуальный. Bombina variegata питается в основном насекомыми и их личинками, улитками и арахнидами или изоподами. Желтобрюхая жерлянка внесена в красный список находящихся под угрозой видов МСОП, ее статус в Европе - «уязвимый» и популяции сокращаются.
Кариотип Bombina variegata состоит из 24 хромосом (2n).
А теперь выбранный в итоге организм - Дальневосточная жаба (Asiatic toad or Chusan Island toad, Bufo gargarizans)
Дальневосточная жаба очень похожа на Bufo bufo Жабу обыкновенную, но отличается более выраженными бородавками и меньшими размерами тела (10-15см). Так же как следует из названия обитает она в Азии. Как и у других жаб, у нее есть ядовитые железы за глазами, выделяющие буфотоксины. Ее обработанный яд используют в традиционной китайской медицине.
Кариотип Bufo gargarizans состоит из 22 хромосом (2n).
По запросу Bufo gargarizans (Asiatic toad) была найдена 1 референсная сборка генома - ASM1485885v1, которая имеет уровень Chromosome.
Характеристики сборки.
| D GenBank | GCA_014858855.1 |
|---|---|
| ID RefSeq | GCF_014858855.1 |
| Общий размер генома (п.н.) | 4 545 465 442 |
| Число фрагментов (хромосом) генома в сборке | 11 (гаплоидный набор) |
| Число скэффолдов | 747 |
| N50 скэффолдов | 539 822 115 |
| L50 скэффолдов | 4 |
| Число контигов | 4 620 |
| N50 контигов | 1 738 317 |
| L50 контигов | 749 |
Количество контигов и число скэлффолдов не совпадает с количеством хромосом, а так же уровень сборки подразумевает возможность наличия гепов между скэффолдами, что не позволяет говорить о том, что данная сборка хорошо отражает биологию организма, но все же она имеет статус референсной то будем считать, что сборка приемлемо отражает биологию. А так же количество хромосом совпадает с указанным в другом источнике [3].
N50 - если взять все наибольшие по длине фрагменты генома так чтобы в них содержалось 50% нуклеотидов то N50 это длина наименьшего из них. L50 - наименьшее число фрагментов генома в которых собержится 50% нуклеотидов.
Скачанные файлы.
| GCF_014858855.1_ASM1485885v1_genomic.fna.gz | последовательности ДНК генома в формате FASTA |
|---|---|
| GCF_014858855.1_ASM1485885v1_protein.faa.gz | последовательности белков в формате FASTA |
| GCF_014858855.1_ASM1485885v1_genomic.gbff.gz | аннотированный геном |
Знакомство с поисковыми системами ENA и NCBI.
Мною были выбраны белки иммуноглобулины. Далее будут описаны запросы и их результаты в базах данных.
NCBI.
| immunoglobulin[Title] AND (biomol_genomic[PROP] OR biomol_mrna[PROP]) |
Запрос позволяет увидеть сколько записей генов и мРНК содержат в названии immunoglobulin. Количество результатов - 417030.
| immunoglobulin[Title] AND (biomol_genomic[PROP] OR biomol_mrna[PROP]) AND ddbj_embl_genbank[filter]) |
| immunoglobulin[Title] AND ((biomol_genomic[PROP] OR biomol_mrna[PROP]) AND refseq[filter]) |
Записей из GenBank - 318233, a из RefSeq - 98672.
| immunoglobulin[Title] AND ("Homo sapiens"[Organism] AND biomol_genomic[PROP] AND ddbj_embl_genbank[filter]) |
| immunoglobulin[Title] AND ("Homo sapiens"[Organism] AND biomol_mrna[PROP] AND ddbj_embl_genbank[filter]) |
| immunoglobulin[Title] AND ("Homo sapiens" [Organism] AND biomol_genomic[PROP] AND refseq[filter]) |
| immunoglobulin[Title] AND ("Homo sapiens"[Organism] AND biomol_mrna[PROP] AND refseq[filter]) |
Записей описывающих последовательности человека из GenBank: генов - 95410, мРНК - 99661; из RefSeq: генов - 73, мРНК - 710.
ENA.
| tax_eq(9606) AND description="immunoglobulin" AND mol_type="genomic dna" |
| tax_eq(9606) AND description="immunoglobulin" AND mol_type="mrna" |
Теперь рассмотрим базу данных ENA, поиск менее удобный, но количество генов иммуноглобулинов у человека - 94640, а мРНК - 92873.
Источники
1. Vitelli, L., Batistoni, R., Andronico, F., Nardi, I., & Barsacchi-Pilone, G. (1982). Chromosomal localization of 18S + 28S and 5S ribosomal RNA genes in evolutionarily diverse anuran amphibians. Chromosoma, 84(4), 475–491. doi:10.1007/bf00292849
2. Tan, S., Li, P., Yao, Z., Liu, G., Yue, B., Fu, J., & Chen, J. (2021). Metabolic cold adaptation in the Asiatic toad: intraspecific comparison along an altitudinal gradient. Journal of Comparative Physiology B. doi:10.1007/s00360-021-01381-x
3. Chen, Q.; Shi, S.; Lu, N.; Shen, C.; Jiang, J. Karyotypes of 10 Anuran Species from the Qinghai–Tibetan Plateau. Diversity 2023, 15, 947. https://doi.org/10.3390/d15090947