Гепард(Acinonyx jubatus) обитает в большинстве стран Афирики, а также на Ближнем Востоке. Во времена Высокого и Позднего Средневековья гепарды активно использовались знатью восточных государств для охоты, поскольку эти кошки почти не проявляют агрессии к человеку. У третьего падишаха Великой Империи Моголов Акбара число одновременно живших при дворе гепардов могло достигать тысячи.
Для выполнения практикума был выбран именно этот зверь, потому что я люблю диких кошек, и соответствующая геномная сборка подходила по всем требуемым параметрам, а именно: имеются аннотированные гены, качество сборки имеет хромосомный уровень, сама сборка помечена как референсная.
| Характеристика | Референсная сборка Acinonyx jubatus |
| Идентификатор GenBank | GCA_027475565.2 |
| Идентификатор RefSeq | GCF_027475565.1 |
| Уровень сборки генома | Chromosome |
| Общий размер генома | 2.4 Gb |
| Число хромосом в сборке | 19 |
| Scaffold N50 | 144.4 Mb |
| Scaffold L50 | 7 |
| Contig N50 | 96.8 Mb |
| Contig L50 | 9 |
В выбранной сборке генома Acinonyx jubatus содержится информация только для гаплоидного набора. Так, 19-ти хромосомам соответствуют 217 контигов и 195 скэффолдов. Помимо выбранной, для гепарда имелись еще две сборки, но они были сделаны на уроне скэффолдов и не подходили для выполнения практикума. Сами же записи нашлись через расширенный поиск NCBI по латинскому названию единственного сохранившегося до наших дней среди гепардов вида Acinonyx jubatus.
Уровень Chromosome для рассматриваемой записи означает, что в сборке имеются последовательности для всех хромосом. В моем случае можно сделать вывод, что они состоят из скэффолдов, поскольку в записи указано, что 176 скэффолдов не были размещены. Рассматриваемую сборку можно назвать достаточно полной, хоть она и сделана для гаплоидного n набора. Гаплоидная сборка несет усредненную информацию об организме и не отражает гетерозиготность по некоторым аллелям и индивидуальные особенности последовательностей материнской и отцовской хромосом, но в случае гепардов это не то чтобы очень необходимо: данный вид имеет крайне низкое генетическое разнообразие из-за двух бутылочных горлышек, через которые он прошел 100 и 12 тысяч лет назад.
Также для выбранного зверя в формате FASTA были скачены нуклеотидные последовательности генома, последовательности белков, а также последовательности генома с аннотацией в формате GBFF.
Для выполнения задания был выбран пропердин. Это глобулярный белок, обнаруженный в сыворотке крови высших животных. Он редставляет собой несколько растворённых в кровотоке проферментов, относящихся к системе комплемента, которая обеспечивает врождённый иммунитет. Известно, что пропердин участвует в некоторых специфических иммунных реакциях. Он играет роль в воспалении ткани, а также в процессе поглощения фагоцитами патогенов, кроме того, известно его участие в нейтрализации некоторых вирусов.
С помощью Advanced Search в NCBI среди нуклеотидных баз данных нашли 879 записей, посвященых генам и мРНК пропердина. Из них 12 записей о генах, 867 об мРНК. Соответсвующие запросы:
properdin[Title] AND (biomol_genomic[PROP] OR biomol_mrna[PROP])
properdin[Title] AND biomol_genomic[PROP]
properdin[Title] AND biomol_mrna[PROP]
Из 879 записей мРНК и генов к GenBank относятся 292, а к RefSeq 587, что отображается на боковой панели слева в фильтре Source databases.
При следующем запросе получаем 11 записей и таким образом делаем вывод, что записей генов из GenBank 11, из RefSeq - 1:
properdin[Title] AND biomol_genomic[PROP] AND ddbj_embl_genbank[filter]
Записей мРНК в RefSeq 586, в GenBank 281:
properdin[Title] AND biomol_mrna[PROP] AND refseq[filter]
Количество записей, описывающих человека(properdin[Title] AND "Homo sapiens"[porgn]): GenBank(genomic DNA/RNA) - 8, GenBank(mRNA) - 23, RefSeq(genomic DNA/RNA) - 1, RefSeq(mRNA) - 2.
Не все записи содержат последовательности, кодирующие проперпдин. Это можно проверить, если в поиске задать следующую комбинацию:
("properdin"[Title] AND "Homo sapiens"[porgn:__txid9606] NOT "similar to"[Title])
В результате высвечиваются только 16 записей. Если использовать Advanced Search на сайте ENA, то по следующему запросу, в котором мы ищем мРНК пропердина у человека
tax_tree(9606) AND description="properdin" AND mol_type="mrna"
мы получим 23 записи. По запросу
tax_tree(9606) AND description="properdin" AND (mol_type="genomic dna" OR mol_type="genomic rna")
получим 8 записей.