Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2020

Для выполнения заданий нужны:

1) ЭТ genomes_fasta_results составленная ранее мной при проверке пр.11.1 не думал, что пригодится:)

2)Некоторые колонки из страницы genes вашего файла с сопроводительными материалами. Лучше покажу какие:

locus_tag        # feature class        type    protein
BUAPTUC7_RS00005   gene  protein_coding CDS     with_protein
BUAPTUC7_RS00010   gene  protein_coding CDS     with_protein
BUAPTUC7_RS01945   gene  pseudogene     CDS     without_protein
BUAPTUC7_RS03130   gene  pseudogene     CDS     without_protein
BUAPTUC7_RS03095   gene  RNase_P_RNA    ncRNA   RNase_P_RNA
BUAPTUC7_RS01235   gene  rRNA           rRNA    
BUAPTUC7_RS02480   gene  rRNA           rRNA    

Названия и порядок колонок у вас могут могут быть другими, это не важно

1. Сохранить информацию о длинах ДНК, составляющих ваш геном в файле с сопроводительными материалами

У большинства геном - одна ДНК, но есть и другие случаи. Информацию можно взять из ЭТ genomes_fasta_results

2. Составить таблицу типов генов и числа генов каждого типа

Проверяется строчка о генах в вашем геноме и генах в общей таблице Google sheet число генов в геноме по типам

Если у вас появляется РНК типа, которого нет в таблице - называете первую пустую колонку этим типом и заолняете.

Не входит в это задание, но входит в задание на неделю та же информация на листе "genes_per_types" в вашем файле с сопроводительными материалами для мини-обзора. Покажу пример формата

Gene_type       Count
protein_coding  …
pseudogene      …
tRNA            …
rRNA            …
…               …

В мини-обзоре м.б красивее отдельно про гены и псевдогены белков, отдельно про РНК. Вам решать.