Нуклеотидные банки данных

Задание 1

Для этого задания нужно было выбрать любой эукариотический организм. Я выбрал речную выдру (лат. Lutra lutra, англ. Eurasian otter). Речная выдра это вид хищных млекопитающих из семейства куньих, они живут по берегам пресных водоемов, их ареал протягивается от Португалии до Корейского полуострова. Вот милое видео, где в стаю выдр внедрился робот-выдра.

Выдра вблизи

Выдра лежит

Я не нашел данных о количестве хромосом, кроме других сборок в базах данных. Однако эта сборка сделана с HiC, поэтому предсказанному числу хромосом можно верить

Свою сборку я нашел среди геномов в NCBI следующим запросом:

По нему нашлось 2 сборки, одна собрана на уровне контигов и не аннотирована, вторая имеет хромосомный уровень сборки и аннотирована в RefSeq. Я выбрал вторую сборку. Хромосомный уровень означает, что в сборке присутствуют последовательности одной или более хромосом. Последовательности хромосом могут быть полными или состоять из скаффолдов и контигов с гэпами между ними. Эта сборка является референсным геномом, это значит, что это проверенная человеком сборка высокого качества, которая используется как стандарт при сравнении с другими данными

Задание 2

Информация о сборке представлена в Таблице 1.

Таблица 1. Информация о сборке
Идентификатор GenBank Идентификатор RefSeq Общий размер генома Scaffold N50 Scaffold L50 Contig N50 Contig L50
GCA_902655055.2 GCF_902655055.1 2 438 442 342 149 Mb 7 30.4 Mb 23

L50 — минимальное число контигов (скаффолдов), чья суммарная длина составляет не менее половины суммарной длины сборки. N50- длина минимального контига (скаффолда) при суммировании длин минимального числа контигов (скаффолдов) так, чтобы их суммарная длина составляла половину или более от суммарной длины сборки

Задание 6

В моей сборке есть ДНК митохондрии, я это понял по тому, что на странице сборки среди хромосом есть одна, которая называется MT. Мои предположения подтвердились, в ней закодированы митохондриальные белки. Информация о митохондриальной хромосоме представлена в Таблице 2

Таблица 2. Информация о митохондриальной хромосоме
Идентификатор записи Тип органеллы Число кодирующих последовательностей (CDS) Число генов рРНК Число генов тРНК Число псевдогенов
NC_062277.1 Митохондрия 13 2 22 0