Учебная страница курса биоинформатики,
год поступления 2020
Для выполнения заданий нужны:
1) ЭТ genomes_fasta_results составленная ранее мной при проверке пр.11.1 не думал, что пригодится:)
2)Некоторые колонки из страницы genes вашего файла с сопроводительными материалами. Лучше покажу какие:
locus_tag # feature class type protein BUAPTUC7_RS00005 gene protein_coding CDS with_protein BUAPTUC7_RS00010 gene protein_coding CDS with_protein BUAPTUC7_RS01945 gene pseudogene CDS without_protein BUAPTUC7_RS03130 gene pseudogene CDS without_protein BUAPTUC7_RS03095 gene RNase_P_RNA ncRNA RNase_P_RNA BUAPTUC7_RS01235 gene rRNA rRNA BUAPTUC7_RS02480 gene rRNA rRNA
Названия и порядок колонок у вас могут могут быть другими, это не важно
1. Сохранить информацию о длинах ДНК, составляющих ваш геном в файле с сопроводительными материалами
У большинства геном - одна ДНК, но есть и другие случаи. Информацию можно взять из ЭТ genomes_fasta_results
2. Составить таблицу типов генов и числа генов каждого типа
Проверяется строчка о генах в вашем геноме и генах в общей таблице Google sheet число генов в геноме по типам
Если у вас появляется РНК типа, которого нет в таблице - называете первую пустую колонку этим типом и заолняете.
Не входит в это задание, но входит в задание на неделю та же информация на листе "genes_per_types" в вашем файле с сопроводительными материалами для мини-обзора. Покажу пример формата
Gene_type Count protein_coding … pseudogene … tRNA … rRNA … … …
В мини-обзоре м.б красивее отдельно про гены и псевдогены белков, отдельно про РНК. Вам решать.