Задания по теме лекции 1
Отчет о выполненных заданиях присылайте А.В.Алексеевскому в файле Word или аналогичной программы на адрес <aba AT belozersky DOT msu DOT ru>
Отчет должен содержать короткий текст с объяснениями и вашими комментариями.
Выполнение задания 1 обязательно для зачёта по теме лекции 1.
Зачет темы – при выполнении еще трех заданий. Каждый пункт (размер генома и описание) задания 6 идет за 1.
Задание 1
Известна последовательность одной цепочки ДНК:
ATGACCAAA
Напишите последовательность второй цепочки.
Задание 2
- a) Узнайте диаметр любой примерно шарообразной клетки человека. Укажите какая клетка, её диаметр. b) Пропорционально увеличим клетку до размера арбуза. Какой толщины будет мембрана?
Пояснения
- Толщина мембраны клетки указана в презентации, она примерно одинакова для всех клеток.
Для воображения: мембрана - липидный бислой ("би-" т.к. два слоя), т.е. пленка из жира. Так устроена защита клетки от внешности
Задание 3
Under construction!
Определите сколько геномов SARS-CoV-2 секвенировано в России. Сравните с какой-либо другой страной.
Пояснения Будут позже.
Задание 4
- a) Сколько разных молекул ДНК имеется в одной клетке (не половой) у человека.
Пояснения
Двух-цепочечную ДНК считать за одну.
Одну и ту же ДНК от папы и от мамы считать за одну, т.к. они очень похожи (на 99.9%).
- b)Сколько штук молекул ДНК содержатся в ядре клетки человека
Задание 5*
*Для умеющих программировать
Проверьте верны ли некоторые наблюдения, приведенные на слайде "Лингвистический анализ" презентации, для коронавируса и парочки других вирусов. См. указания где взять геномы вирусов.
Пояснения
Геном находится по идентификатору на сайте NCBI https://www.ncbi.nlm.nih.gov/ в базе данных
Nucleotide. Для скачивания выбрать формат Fasta, это текстовый формат для последовательности, первая строчка: идентификатор(до первого пробела) и краткое описание. Например:
>NC_002642.1 Yaba-like disease virus, complete genome AATTTAAACCTTTATTTATAATTTATAACTGGAAAAAAAATAGTAAACACACACGTTTATAATTAACTTT TAATGTGTTTTTAATGAAAAACGGCTTTTAAAGCCAACGTAAATAGAATTTTTTGTTTTAATTGTTAAAA ......................................................................
Вирус обезьяны Яба, Геном - двухцепочечная ДНК. Идентификатор NC_002642 (".1" - это номер версии, указывать не обязательно)
Вирус ВИЧ, геном - одноцепочечная +РНК. В клетке хозяина с РНК делается комплементарная копия двухцепочечной ДНК и эта ДНК встраивается в геном хозяйской клетки (человека). Идентификатор NC_001802.1
SARS-CoV-2. Идентификатор NC_045512.2
Другой путь доступа к геномам: https://www.ncbi.nlm.nih.gov/genome и далее по ссылкам.
Задание 6. Заполните таблицу размеров геномов, приведенную на стр. 54 презентации
Пояснения
- Обязательно укажите (под таблицей) вид, источник информации и ваши комментарии
- Засчитывается, если заполнены не менее 4х ячеек.
"Абсолютная категория"* - может, категории из первых трех строк формально охватывают не все геномы? Подсказка: геномом назовем молекулу нуклеиновой кислоты (ДНК или РНК), которая способна размножаться - реплицироваться - в природе, неважно как.
Задание 7
- Чем вирус отличается от бактерии?
Пояснение Много различий можно найти в интернете. Постарайтесь выделить ключевое - с вашей точки зрения. Не бойтесь ошибиться или пойти против популярных определений! Оценивать будем логику ваших комментариев (даже ошибочных).
Задание 8
Приведите интересный пример животного (animal)организма, геном которого секвенирован.
Как и везде, нужна ссылка на источник; ваши комментарии приветствуются.
Приведите источники данных и комментарии
Указания
red Under construction
Задание 2.
Список геномов уханьского коронавируса (SARS-CoV-2) найдете по адресу https://www.ncbi.nlm.nih.gov/genbank/2019-ncov-seqs/
Выберите геном из колонки RefSeq. Эта запись проверена экспертами. Пройдите по ссылке. Справа найдете ссылку Run BLAST, пройдите по ней. BLAST это программа для поиска похожих последовательностей в базах данных.
В окошке Organism напишите Coronavirus (выберите строчку с указанием (taxid ...). Это позволит ускорить поиск.
Пуск кнопка BLAST.
Находки BLAST упорядочены по надежности. Надежность меряется параметром E-value, чем меньше E, тем надежнее.
Coverage – покрытие. Coverage равно проценту длины участка похожести в вашем белке от полной длины вашего белка
Identity –Identity равно проценту сопоставленных одинаковый аминокислотных остатков (букв) от длины выравнивания.
Задание 5
Забыл во-время указать какие геномы взять. Приношу извинения. ААл
Задание 6.
Используйте ссылку на базу данных Genomes: https://www.ncbi.nlm.nih.gov/genome
Далее Browse by Organism.
Задание 1. Постройте карты сходства для двух пар бактериальных геномов
Задание 2. Найдите и включите в отчет ответы на не менее, чем три вопроса
У кого самый маленький геном? (Я даже не решаюсь назвать его организмом Это геном, который умеет воспроизводить сам себя - не без помощи других - но не людей). Приведите название и размер генома.
Указания.
Задание 0. См. лекцию.
Задание 1.
Как выбрать геномы подходящих бактерий.
Подходящий выбор – геномы двух штаммов одного вида. Можете выбрать известные вам бактерии. С помощью Google найдите видовое название бактерии. Оно может выглядеть примерно так: Bacillus subtilis, Escherichia coli, Salmonella typhi, Mycobacterium tuberculosis и проч. Первое слово – название рода, второе – название вида.
Как выбрать геномы двух штаммов одного вида
Перейдите на страницу базы данных Genomes: https://www.ncbi.nlm.nih.gov/genome Далее по ссылке Browse by Organism. В окошко поиска скопируйте название вида. Например, Bacillus subtilis. Если нашли, то перейдите по ссылке в колонке Assembly. Откроется список штаммов, которых секвенирован геном.
Брать только те, для которых (i) в колонке level стоит полностью черный круг (значит, что геном собран полностью, без пропусков; (ii) в колонке Replicon указана только одна хромосома; например, так: "сhromosome:NC_000964.3/AL009126.3". Если указаны еще плазмиды (маленькие ДНК), оставьте их без внимания. Вам нужно скопировать в отчет идентификаторы записи с хромосомой. В примере это NC_000964.3 и AL009126.3 – идентификаторы одной и той же записи в разных базах данных. Оба годятся.
После того, как сохранили идентификаторы для двух штаммов, стройте карту.
Как построить карту сходства.
Программа blast на сайте https://blast.ncbi.nlm.nih.gov/Blast.cgi. Перейдите по ссылке Nucleotide blast. Поставьте галочку против «Align two or more sequences»
В два окошка для двух последовательностей («Enter accession number») вставьте идентификаторы последовательностей.
Отметьте вариант алгоритма "Somewhat similar sequences (blastn)".
Нажмите кнопку "BLAST". Дождитесь результата.
Чтобы увидеть карту, нажмите плюсик рядом с "Dot matrix view".
Чтобы найти процент одинаковых остатков, в секции Alignments (выравнивания) посмотрите информацию над первым выравниванием. А именно, информацию такого вида:
Identities 137102/146807(93%)
Identities – совпадения букв в выравнивании; 137102 – число совпадений из 146807 – длины выравнивания. На карте каждое выравнивание соответствует диагонали. Какой именно – можно понять, т.к. координаты обоих фрагментов геномов указаны в самом выравнивании.