Учебная страница курса биоинформатики,
год поступления 2010
Реляционные базы данных, MySQL
Решением каждой задачки является ОДИН запрос.
Для разминки:
- Узнать среднюю длину гена для каждого генома. Вывести идентификаторы геномов и среднюю длину генов для каждого из них.
- Узнать, сколько в каждом геноме генов, название которых состоит ровно из 3 символов. Вывести идентификаторы геномов и количество таких генов по убыванию количества генов.
Немного посложнее (для решения этих задач вам потребуется запрос с JOIN):
- Узнать долю кодирующих последовательностей в геноме c genome_id=191.
- Вывести все пары генов для генома c genome_id=191, расстояние между которыми не больше 50.
- Вывести CDS у которых UNIPROT ID равен P39404 или P0AFH8 (связка UNIPROT ID и CDS находится в таблице cds_ref).