EMBOSS

Упражнения

Упражнение 1. Файлы в формате fasta с названием, кончающимся на "а", собраны в единый файл.

Упражнение 2. Один файл в формате fasta с несколькими последовательностями разделен на отдельные fasta файлы.

Упражнение 4. Транслирована последовательность.

Упражнение 5. Последовательность транслирована в 6 рамках.

Упражнение 6. Выравнивание переведено в формат msf.

Задания

Задание 1
Была выбрана хромосома археи Methanosaeta concilii GP6 из первого семестра, AC записи с хромосомой NC_015416.1. Получен список открытых рамок считывания
  • getorf mconcilii.fasta -table 11 -minsize 180 -circular -find 0, далее указывается файл nc_015416.orf
  • infoseq nc_015416.orf -nousa -notype -outfile nc_015416.xls
  • После этого полученная табличка была отредактирована в экселе.
    nc_015416.xls
    Задание 2
    Были скачаны все нужные файлы и сделана табличка с аннотированными генами данной археи.
    nc_015416_annot.xls
    proteinsannot.faa
    Задание 3
    Количество аннотированных генов представляют собой примерно 13% от количества найденных открытых рамок считывания.
    При анализе общей таблицы было выявлено множество нюансов.
    1. Подавляющему числу рамок не соответствует ни один аннотированный ген.

    Рис1. Отсутствие генов для многих рамок.

    2. Так как в параметрах getorf мы вводим поиск от стоп-кодона до стоп-кодона, позиции концов рамки и соответствующего гена, как правило, различаются на 3.

    Рис2. Отличие координат концов.

    3. Рамка оказалась гораздо короче гена. Видимо, по каким-то причинам стоп-кодон внутри гена игнорируется.

    Рис3. Рамка короче гена.

    4. Также есть 25 генов, продукт которых короче 60 аминокислот, поэтому getorf с нашими параметрами не нашел их.

    Рис4. Белок короче 60 амк.

    5. Были случаи, когда рамка выходила длиннее, чем белок. Либо программа не заметила стоп-кодон, либо почему-то трансляция терминируется раньше стоп-кодона.

    Рис5. Рамка длиннее гена.



    Назад к странице третьего семестра.


    © Aleksei Efremov, 2015