Задание 1
Мой выбор пал на морского ежа, так как на ряду с остальными иглокожими он относится к вторичноротым, что говорит об образовании у него ротового отверстия вне бластопора. Также интересно, что личинка иглокожих имеет двустроннюю симметричность, которая во взрослой стадии меняется на лучевую и это относительно позднее эволюционное приобретение [1]. Одной из причин такого перехода может являться транслокация Hox-кластера, гены которого ответственны за формообразование или перекрытие зон экспрессии Otx и Hox генов, что уникально для иглокожих.Количество хромосом, содержайщееся в организме зависит от вида. Так, например, у зеленых морских ежей их 38, а у бурых- 34.
![lys25](ezh_pr7_sem3.jpg)
![asn81](ezh2_pr7_sem3.jpg)
![asn81](ezhVnutri_pr7_sem3.jpg)
Латинское название: Echinoidea.
Английское название: Sea urchins.
Запрос Echinoidea в NCBI Genomes обнаружил 18 сборок.
Была выбрана сборка для Lytechinus variegatus (зеленый морской еж) из семейства Toxopneustidae. Сборка имеет аннотированные гены как в RefSeq, так и в GenBank.
Уровень сборки: Chromosome (сборка содержит последовательности 20 хромосом и скаффолды).
Выбранная сборка является референсной, что означает, что она проаннатирована и была отоборна вручную как наиболее качиственная, в сравнении с другими сборками.
Задание 2
Таблица 1. Основная информация о выбранной сборке.
Идентификатор GenBank | Идентификатор RefSeq | Общий размер генома | Scaffold N50 | Scaffold L50 | Contig N50 | Contig L50 |
---|---|---|---|---|---|---|
GCA_018143015.1 | GCF_018143015.1 | 869.6 Mb | 45.6 Mb | 7 | 5.9 Mb | 44 |
Параметр Scaffold/Contig N50 означачает длину скаффолда/контига, для которого 50% всех нуклеотидов сборки содежится в скаффолдах/контигах как минимум такой длины или больше.
Параметр Scaffold/Contig L50 означает наименьшее число скаффолдов/контигов, в которых содержится половина (50%) всех нуклеотидов сборки.
Задание 3
Скаченные файлы:
Последовательности белков (в формате FASTA): GCF_018143015.1_Lvar_3.0_protein.faa
Нуклеотидные последовательности генома (в формате FASTA): GCF_018143015.1_Lvar_3.0_genomic.fna
Последовательности генома с аннотацией (GBFF): GCF_018143015.1_Lvar_3.0_genomic.gbff.gz
Источники:
[1]: ссылка на статью.