Практикум 7

или "а какое твое любимое животное?"

Работа со сборкой генома эукариотического организма

Задание 1. Выбор сборки генома эукариотического организма

Для выполнения заданий данного практикума в качестве эукариотического организма была выбрана Обыкновенная Выдра, она же Речная Выдра, она же Порешня, она же Eurasian river otter, она же Lutra lutra. Почему выдра? Все до банальности просто: они очень милые, а еще они держат друг друга лапками, когда спят, чтобы их не унесло течением :)

Но несмотря на милый внешний вид, выдра - хищник. Встретить ее можно по всей Европе, в Турции, Центральной Азии, за Уралом, на Дальнем Востоке, в Китае, Корее и даже на Севере Африки. Ведут выдры полуводный образ жизни, ныряя и добывая себе рыбу в воде, рядом с которой и проживают. Выдры крайне чистоплотные животные, а еще являются прекрасными матерями, заботясь и защищая потомство от гораздо более крупных хищников. Это очень смышленные и разговорчивые животные: общаясь друг с другом, они используют около 12 видов различных звуковых сигналов, они стрекочут, верещат, шипят, свистят.

В кариотипе у выдр 2n = 38хромосом. Информация взята из книги "Млекопитающие севера нижнего Поволжья".

Рис.1. Фотографии чудесной Lutra lutra

По моему поисковому запросу "Lutra lutra (Eurasian river otter)" было найдено 2 сборки. Я выбрала сборку с уровнем сборки "Chromosome", то есть имеющую последовательность для одной или нескольких хромосом. Сама последовательность при этом может содержать пробелы. Выбранная мной сборка является референсной. Это значит, что ее вручную выбрали в качестве стандарта как наиболее качественную.

Рис.2. Результаты поискового запроса

Задание 2. Некоторые характеристики выбранной сборки

Таблица 1. Некоторые характеристики выбранной сборки

Небольшие пояснения:

*N50: Длина контига(или скаффолда), для которого половина всех нуклеотидов сборки содержится в контигах(скаффолдах) такой или большей длины.

**L50: Минимальное число контигов(или скаффолдов), в которых содержится половина всех нуклеотидов сборки.

Задание 3. Скачивание файлов

Я скачала с сайта NCBI следующую информацию о моей сборке:

1.Нуклеотидные последовательности генома(в формате FASTA). Ссылка: GCF_902655055.1_mLutLut1.2_genomic.fna

2.Последовательности белков(в формате FASTA). Ссылка: GCF_902655055.1_mLutLut1.2_protein.faa

3.Последовательности генома с аннотацией(GBFF). Ссылка: GCF_902655055.1_mLutLut1.2_genomic.gbff