Работа в командной строке Linux. Программы пакета EMBOSS



I.Команды


1.Команда ls показывает содержимое рабочей директории.

2.Команда ls .. показывает содержимое наддиректории.

3.Команда cd .. перемещает вверх на одну директорию.
После какого-то количества выполнений этой команды, результат, выдаваемый командой ls перестаёт меняться. Это связано с тем, что выше директорий нет.

4.Команда pwd показывает полный путь к рабочей директории.

5.Команда more X, где Х - имя файла, показывает содержимое файла в виде текста.
more ahpf_ecoli.fasta - а.о. последовательность моего белка в формате fasta
more ahpf_ecoli.entret - содержимое файла белка из базы UniProt
more P и Tab, где P - первая буква названия файла, выдаёт название этого файла (при условии, что больше в директории нет файлов, чьи названия начинаются на эту букву)

При нажатии клавиши enter открывается следующая строчка файла. При нажатии пробела - следующий относительно крупный фрагмент файла.

6.Нажатие стрелок вниз и вверх позволяет переключаться между последними командами.

7.Команда history выводит список команд пользователя с первого входа на сервер.

II.Глобальные и локальные выравнивания


1.Полученные глобальные выравнивания AHPF_Ecoli и TRXB_Bacsu

- стандартные параметры (штраф за гэп - 10, штраф за протяжённость гэпа - 0.5). Вес - 479.5 *
Иллюстрация

- заданные параметры (20 и 1 соответственно). Вес - 451 *
Иллюстрация

Как мы можем наблюдать, при увеличении штрафов за гэпы программа стремится уменьшить их количество и длину, добиваясь максимального веса выравнивания.
Так, при менее строгих параметрах позиции №239 AHPF_Ecoli соответствует гэп в последовательности TRXB_Bacsu, а во втором случае его нет.





В качестве примера изменений: позиции №240 AHPF_Ecoli в первом случае соответствует №33 другой последовательности, а во втором - №34.

2.Полученные локальные выравнивания

- стандартные параметры (10 и 0.5) *
Иллюстрация

- заданные параметры (20 и 1). *
Иллюстрация

- заданные параметры (5 и 0.25). *
Иллюстрация

Изменение параметров довольно сильно отражается на выравнивании (особенно при либеральных значениях штрафов - берётся даже другой фрагмент, более длинный)





Примеры: позиции №195 TRXB_Bacsu в первом случае соответствует №405 AHPF_Ecoli, а в третьем напротив неё стоит гэп. Соответствие позиций в последовательностях AHPF_Ecoli и TRXB_Bacsu при стандартных параметрах №38-№245, а при увеличенных - №38-№244 (из-за уменьшения протяжённости гэпа).

Судя по моим наблюдениям, при одних и тех же параметрах участки локального выравнивания полностью идентичны соответствующим фрагментам глобальных.

Посмотреть карту локального сходства
Совпадающие позиции обозначаются точками в координатах: х=№позиции в AHPF_Ecoli, у=№позиции в TRXB_Bacsu. Отрезки, расположенные параллельно, представляют собой разные варианты выравниваний.

Скачать список из 10 субоптимальных выравниваний
Программа Water выдаёт пользователю только одно из построенных локальных выравниваний - с самым большим весом. Чтобы увидеть остальные, нужна программа Matcher.
Второе выравнивание из предыдущего задания оказалось наиболее оптимальным из всех локальных: вес - 455. В остальных случаях цифра оказалась значительно более скромной (от 26 до 38 - что, впрочем, скорее связано с размерами). Приведу кое-какие результаты.
#=======================================
#
# Aligned_sequences: 2
# 1: AHPF_ECOLI
# 2: TRXB_BACSU
# Matrix: EBLOSUM62
# Gap_penalty: 14
# Extend_penalty: 4
#
# Length: 15
# Identity:       7/15 (46.7%)
# Similarity:    11/15 (73.3%)
# Gaps:           0/15 ( 0.0%)
# Score: 38
# 
#
#=======================================

       360       370  
AHPF_E VAVIGGGNSGVEAAI
       : .:: : .:. ::.
TRXB_B VIIIGAGPAGMTAAV
       10        20   


#=======================================
#
# Aligned_sequences: 2
# 1: AHPF_ECOLI
# 2: TRXB_BACSU
# Matrix: EBLOSUM62
# Gap_penalty: 14
# Extend_penalty: 4
#
# Length: 31
# Identity:       6/31 (19.4%)
# Similarity:    15/31 (48.4%)
# Gaps:           0/31 ( 0.0%)
# Score: 35
# 
#
#=======================================

           220       230       240    
AHPF_E DVLIVGSGPAGAAAAIYSARKGIRTGLMGER
       ....:: : .     .:  :   .  ..  :
TRXB_B ELVVVGGGDSAVEEGVYLTRFASKVTIVHRR
        150       160       170       


#=======================================
#
# Aligned_sequences: 2
# 1: AHPF_ECOLI
# 2: TRXB_BACSU
# Matrix: EBLOSUM62
# Gap_penalty: 14
# Extend_penalty: 4
#
# Length: 23
# Identity:       6/23 (26.1%)
# Similarity:    10/23 (43.5%)
# Gaps:           0/23 ( 0.0%)
# Score: 32
# 
#
#=======================================

              310       320   
AHPF_E GLHQIETASGAVLKARSIIVATG
       :.       ::  : . ..:  :
TRXB_B GVSYCAVCDGAFFKGKELVVVGG
              140       150   


К перечню исследовательских работ
На главную