Учебная страница курса биоинформатики,
год поступления 2018
Практикум 3. Подсказки
В компьютерном классе Far Manager v3.0 уже установлен: <Start> -> <All Programs> -> <Base> -> <Far> -> <Far Manager 3>.
На домашний компьютер Far Manager v3.0 можно скачать с официального сайта из раздела загрузить (выбираете последнюю стабильную сборку).
Функцию NetBox имеет смысл использовать в компьютерном классе только для связи с ftp-серверами. Дома она поможет вам копировать файлы на свой диск H. О том, как настроить NetBox, написано ниже.
0. Как настроить Far Manager:
- Как открыть FAR. Откройте "All programs". Далее "Base". Найдите "Far Manager" и щелкните по синей иконке FAR
0.a Настройки окна Far. Переместите указатель мышки на верхнюю (синюю) полоску окна Far, щелкните правой кнопкой мыши; в появившемся меню выберите "Properties".
Для изменения размера окна перейдите на вкладку "Layout". Попробуйте сделать ширину окна равной 100 символам, а высоту – 55. Это сделает окно Far примерно в половину экрана. Следите за тем, чтобы "Screen Buffer Size" был равен "Window Size", иначе будет неудобно работать!
Для изменения шрифта (если хочется его заменить) перейдите на вкладку "Font". Сохраните изменения! При сохранении выберите нужное, внимательно прочитав предлагаемые возможности!
После этого отложите мышку в сторону и используйте только клавиатуру!
По умолчанию, окно FAR состоит из двух панелей. В каждой показывается содержание одной директории на вашем компьютере или на удаленном сервере.
Изменение директории, отображаемо в левой панели.
<Alt+F1> Поддиректории идут первыми в списке и выделены белым шрифтом, имена файлов идут потом. ".." обозначает родительскую (вышележащую) директорию. Переходы по дереву директорий - с помощью стрелок и Enter.
Все то же - с правой панелью, только используйте <Alt+F2>
Панели. В панелях могут отображаться разные атрибуты файлов. Для изменения вида файлов в окне Far: <F9> -> "Left" (или "Right") и пробуйте. Запомните команду быстрого перехода к нужному виду. Я люблю вид панели, получающийся командой <правый Ctrl + F3> ААл.
Относительная ширина панелей. <Ctrl+Left>, <Ctrl+Up> или другие стрелки. Полезно при прочтении длинных имен файлов.
Быстрый переход в директорию.
Настройка: в активной панели -– нужная директория (и курсор). <левый_Ctrl+Shift+k>`, где k – одна из клавиш цифр 1,2,...,9.
Переход: <правый_Ctrl+k>.
Сохранение настроек. <F9> -> "Options" -> "Save setup".
0.b Откройте, например, правую панель <Alt+F2>.
Для связи с удаленным сервером в меню выберите NetBox.
<Shift+F4> — откроется меню.
Связь с сервером kodomo
- в окошке "File protocol" выберите SFTP или SCP (все равно)
Впишите имя компьютера (Host name): kodomo.fbb.msu.ru.
- в меню "Login type" выберите "Normal" (если такого окошка нет - пропустить этот пункт)
- Впишите ваше пользовательское имя (User name):
- то самое, которое Вы используете для входа в свой профиль на компьютерах компьютерного класса и на сайте kodomo.
- Пароль (Password) лучше не вписывать, а вводить каждый раз при подключении.
Нажмите "OK" и укажите имя для сохраняемой записи (например, <username>@kodomo, где <username> — пользовательское имя).
После этого опять <Alt+F2>, выберите NetBox, и, встав курсором на нужную строчку, нажать <Enter>
Далее — копирование как обычно в Far'е. При подключении через NetBox вы сразу попадаете в директорию, соответствующую вашему диску H. Чтобы попасть на диск P, надо "до упора" идти вверх по дереву директорий (то есть идти к корню и переходить в родительскую директорию, пока она есть), а затем перейти в поддиректорию P.
Не рекомендуется открывать через NetBox файлы по ассоциации. Например, если файл aaa.docx находится на вашем компьютере, то обычно достаточно навести на него курсор и нажать <Enter>. При попытке сделать это в панели NetBox программа может "зависнуть". Даже если этого не произойдёт, вы не сможете нормально сохранить документ после внесения в него изменений. Поэтому: сначала копируйте файл на свой компьютер, затем редактируйте, затем копируйте обратно.
Когда вы работаете за одним из компьютеров компьютерного класса, не используйте NetBox для доступа к своим файлам, они — на диске H.
0.c Как создать директорию: нажать клавишу <F7>. Подробности в инструкции по Far.
1,a-c Связь с ftp-сервером NCBI для скачивания генома вируса
В Far <Alt+F2> и среди плагинов выберите "NetBox".
<Shift+F4> — откроется меню.
- в меню "File protocol" выберите "FTP".
Впишите в "Host name" адрес:ftp.ncbi.nlm.nih.gov.
- в меню "Login type" выберите "Anonymous"
- В окошке "User name" рекомендуется оставить слово "anonymous".
- Нажмите "OK" и укажите имя для сохраняемой записи (например, ftp.ncbi).
После этого опять <Alt+F2>, выберите NetBox, и, встав курсором на нужную строчку, нажать <Enter>. Если сервер спросит пароль, введите свой e-mail.
Далее — хождение по файлам и директориям и копирование (но только в одну сторону: на свой компьютер) как обычно в Far'е.
Вот дорожка, по которой ходить: поддиректория genomes (а не 1000genomes - 1000 genomes - это геномы 1000 человек)
Далее - поддиректория viruses
- В ней открывается большой список поддиректорий, каждая названа именем вируса, геном которого как раз и лежит в ней.
- Зайдя в поддиректорию выбранного вируса скопируйте в pr3 файлы с расширениями .gbk, .ffn, ,faa.
Как скопировать файл из директории в правой панели в директорию в левой панели:
- Установить курсор на файл, который хотим скопировать.
<F5>, затем <Enter>. Готово!
Можно скопировать сразу несколько файлов. Для этого нужно по очереди поставить курсор на каждый ивыделить его нажав <Insert>.
<F5>, затем <Enter>. Готово!
1.d Как создать текстовый файл: (<Shift + F4> (см. инструкцию по Far)
Как перенести содержимое одного из файлов с расширением .ffn в созданный файл xxxxxxx_genome.fasta. Открыть оба файла в двух панелях редактором текстов FAR - вызывается клавишей <F4>
Выделить нужный текст <Shift + стрелочки>.
Взять выделение в карман <Ctrl + C>
перейти в другой файл и вставить в нужное место <Ctrl + V>
Сохранить новое содержание файла при выходе <F2>
Выйти из редактора <Esc>
Формат fasta.
Первая строка: ">sequence_name sequence description"
Знак ">" — признак начала информации о последовательности
"sequence_name" — идентификатор последовательности: все символы между ">" и первым пробелом
- Символ пробела (может не быть, если нет описания последовательности)
"sequence description" — описание последовательности в свободной форме (его может и не быть)
Следующие строки до конца файла или до строки, начинающейся с ">" — сама последовательность; символы конца строки, табуляции, пробелы и цифры игнорируются (UPD: Хотя цифры и игнорируются большинством программ, иногда имеет смысл их удалять все равно, по избежании проблем с какой-нибудь программой, которая не будет их игнорировать). Большие и маленькие буквы не различаются.
- Пример:
>y028_bacsu putative protein
MTTCFPRTYYYR
kRppppKLAAAA
AAAPPT RRKKLL
KKLA
2. Создайте файл xxxxxxx_report_virus.txt для сбора информации о геноме.Посмотрите содержимое скачанных файлов и разберитесь как в них найти нужную информацию. Советоваться и спрашивать однокурсников можно, но делать - самому.Можно также искать информацию в google или даже на сайте геномов в NCBI геномы Указывать источник информации обязательно!
2.a Как изменять права на доступ к файлу xxxxxxx_secret.txt в директории credits.
Зайдите на сервер kodomo с помощь NetBox, найдите нужный файл и установите курсор на него.
Нажмите сочетание клавиш <Ctrl + A>.
- В открывшемся меню левее столбика R (права на чтение, от Read) оставьте крестики только для owner и others; против group крестика не должно быть!
- Права на запись - левее столбика W (от Write)- оставьте только себе!
Столбик X - для исполняемых программ. Это файл - программа. Никто не может и не захочет запустить его как программу
Говорят, сегодня на занятии у кого-то не получилось изменить права. Если у вас повторится - жалуйтесь администратору kodomo.
3. Где и как искать число белков - разбирайтесь самостоятельно.Полезны будут файлы .faa и .gbk - в кторых кроме последовательности генома или его фрагмента есть т.н. особенности, частности, кодирующие последовательности - CDS (coding sequences). Будьте внимательны: CDS - всегда кодирует белок, изредка кодирует РНК. Но необходимаю инфрмация всегда написана в полях, относящихся к данной CDS.