== Задания по теме лекции 1 ==
Отчет о выполненных заданиях присылайте А.В.Алексеевскому в файле Word или аналогичной программы на адрес <<MailTo(aba AT belozersky DOT msu DOT ru)>> 

Отчет должен содержать короткий текст с объяснениями и вашими комментариями.

Выполнение задания 1 '''обязательно для зачёта по теме лекции 1'''.

Зачет темы – при выполнении еще трех заданий. Каждый пункты задания 6 идет за 1. 

=== Задание 1 ===
Известна последовательность одной цепочки ДНК:

ATGACCAAA

Напишите последовательность второй цепочки.

=== Задание 2 ===
Определите на геном какого коронавируса больше всего похож геном уханьского коронавируса.

=== Задание 3 ===
Напишите 
 a) Сколько разных молекул ДНК имеется у человека. Разные значит их последовательности в целом непохожи. 
 b)Сколько штук молекул ДНК  содержатся в ядре клетки человека

=== Задание 4 ===
Узнайте диаметр любой примерно шарообразной клетки человека. Подсказку найдете в презентации. 

Примерная толщина мембраны клетки указана в презентации, она примерно одинакова для всех клеток.

Увеличим клетку до размера арбуза. Какой толщины будет мембрана?

=== Задание 5* ===
*Для умеющих программировать

Проверьте верны ли некоторые наблюдения, приведенные на слайде "Лингвистический анализ" презентации, для коронавируса и парочки других вирусов. См. указания где взять геномы вирусов.


=== Задание 6. Ответьте на вопросы по вашему выбору ===
 1. Составьте табличку с колонками: (a)название организма, (b) размер генома, (c) число генов белков в геноме. Заполните ее для (1) двух вирусов; (2) двух бактерий; (3) человека и еще одного эукариотического организма. Напишите, что заметили интересного.
 2. У какого организма самый длинный геном? Приведите название, желательно, картинку и примерную длину генома в парах нуклеотидов. Сравните с размером генома человека
 3. У какой бактерии геном самый маленький? Приведите его размер и, желательно, объяснение с чем связан малый размер генома.
 4. У кого самый маленький геном? Не решаюсь назвать его организмом, так как он может быть вирусом. Приведите название и размер генома.
 5. Чем вирус отличается от бактерии?
 6. У какого вируса самый большой геном? Приведите примерный размер. Сравните с геномом бактерии.
 7. Приведите интересный пример животного (animal)организма, геном которого секвенирован. 


=== Указания ===
{{{#!wiki comment
red
Under construction
}}}


'''Задание 2.'''

Список геномов уханьского коронавируса (SARS-CoV-2) найдете по адресу https://www.ncbi.nlm.nih.gov/genbank/2019-ncov-seqs/

Выберите геном из колонки RefSeq. Эта запись проверена экспертами. Пройдите по ссылке. Справа найдете ссылку Run BLAST, пройдите по ней. BLAST это программа для поиска похожих последовательностей в базах данных.

В окошке Organism напишите Coronavirus (выберите строчку с указанием (taxid ...). Это позволит ускорить поиск.

	Можно менять Algorithm parameters	Max target sequences  - максимальное число выдаваемых находок

Пуск кнопка BLAST. 

Находки BLAST упорядочены по надежности. Надежность меряется параметром E-value, чем меньше E, тем надежнее. 

Coverage – покрытие. Coverage равно проценту длины участка похожести в вашем белке от полной длины вашего белка

Identity –Identity равно проценту сопоставленных одинаковый аминокислотных остатков (букв) от длины выравнивания.

=== Задание 5 ===
''Забыл во-время указать какие геномы взять. Приношу извинения. ААл''

Геном находится по инентификатору на сайте NCBI https://www.ncbi.nlm.nih.gov/ в базе данных 
Nucleotide.

Для скачивания выбрать формат Fasta, это текстовый формат для последовательности, первая строчка: идентификатор и краткое описание. Например:

{{{
>NC_002642.1 Yaba-like disease virus, complete genome
AATTTAAACCTTTATTTATAATTTATAACTGGAAAAAAAATAGTAAACACACACGTTTATAATTAACTTT
TAATGTGTTTTTAATGAAAAACGGCTTTTAAAGCCAACGTAAATAGAATTTTTTGTTTTAATTGTTAAAA
......................................................................
}}} 

Вирус обезьяны Яба, Геном - двухцепочечная ДНК. Идентификатор  '''NC_002642'''    

Вирус ВИЧ, геном - одноцепочечная +РНК. В клетке хозяина с РНК делается комплементарная копия двухцепочечной ДНК и эта ДНК встраивается в геном хозяйской клетки. Идентификатор        '''NC_001802.1'''

Уханьский коронавирус. Идентификатор '''NC_045512'''


 
Задание 6.
  * Хромосома человека - это молекула ДНК вместе с белками, которые с ней связаны 
  * Используйте Google
  * Используйте ссылку на базу данных Genomes: https://www.ncbi.nlm.nih.gov/genome
Далее Browse by Organism. 
  * При выбранном организме  см. его в базе данных Taxonomy. На странице организма есть ссылки на геном. Только complete genomes годятся для того, чтобы узнать размер генома.


{{{#!wiki comment
=== Задание 1. Постройте карты сходства для двух пар бактериальных геномов ===
 1. Выберите близкородственные геномы, например, геномы двух штаммов одного вида бактерий.
  * Постройте и включите карту в отчет. 
  * Опишите не менее двух крупных событий в эволюции от общего предка. Для простоты считайте что один геном такой же, как у общего предка. Тогда опишите, что произошло в эволюции со вторым. Варианты событий: делеция или вставка участка, инверсия, транслокация - перемещение в другое место генома. 
  * Укажите длину и процент одинаковых нуклеотидов в лучшем (первом по порядку) выравнивании пары сходных (гомологичных) участков этих геномов.
 2. То же - для далеких геномов, например, из разных видов одного рода или даже из разных родов. 
  * Постройте и включите в отчет карту сходства
  * Укажите длину и процент одинаковых нуклеотидов на лучшей (первой) паре сходных (гомологичных) участков из этих геномов

=== Задание 2. Найдите и включите в отчет ответы на не менее, чем три вопроса ===
 1. Геномы какого числа эукариот (организмов, клетки которых содержат ядра с ДНК) известны? Приведите два (интересных)примера.
 2. Тот же вопрос для бактерий, архей, и вирусов.
 3. У какого организма самый длинный геном? Приведите название, желательно, картинку и примерную длину генома в парах нуклеотидов.
 4. Каков размер генома человека (примерно)? Примерно сколько в нем генов белков?
 5. У какой бактерии геном самый маленький? Приведите его размер и, желательно, объяснение с чем связан малый размер генома.
 6. У кого самый маленький геном? (Я даже не решаюсь назвать его организмом :) Это геном, который умеет воспроизводить сам себя - не без помощи других - но не людей).  Приведите название и размер генома.
 7. У какого вируса самый большой геном? Приведите примерный размер.
 8. Может ли размер генома вируса превосходить размер генома бактерии? Если да, то приведите примеры.
 9. Чем вирус отличается от бактерии?
  

'''Указания.'''

Задание 0. См. лекцию.

Задание 1. 
  * ''Как выбрать геномы подходящих бактерий.''
Подходящий выбор – геномы двух штаммов одного вида. Можете выбрать известные вам бактерии. С помощью Google найдите видовое название бактерии. Оно может выглядеть примерно так: ''Bacillus subtilis'',   ''Escherichia coli'', ''Salmonella typhi'', ''Mycobacterium tuberculosis'' и проч. Первое слово – название рода, второе – название вида.
  *''Как выбрать геномы двух штаммов одного вида''
Перейдите на страницу базы данных Genomes: https://www.ncbi.nlm.nih.gov/genome
Далее по ссылке Browse by Organism. В окошко поиска скопируйте название вида. Например, ''Bacillus subtilis''. Если нашли, то перейдите по ссылке в колонке Assembly. Откроется список штаммов,  которых секвенирован геном. 

Брать только те, для которых (i) в колонке level стоит полностью черный круг (значит, что геном собран полностью, без пропусков; (ii) в колонке Replicon указана только одна хромосома; например, так: "сhromosome:NC_000964.3/AL009126.3". Если указаны еще плазмиды (маленькие ДНК), оставьте их без внимания. Вам нужно скопировать в отчет идентификаторы записи с хромосомой. В примере это NC_000964.3 и AL009126.3 – идентификаторы одной и той же записи в разных базах данных. Оба годятся. 

После того, как сохранили идентификаторы для двух штаммов, стройте карту.
  *''Как построить карту сходства.''
    Программа blast на сайте https://blast.ncbi.nlm.nih.gov/Blast.cgi. Перейдите по ссылке Nucleotide blast. Поставьте галочку против «Align two or more sequences»
В два окошка для двух последовательностей («Enter accession number») вставьте идентификаторы последовательностей.  

Отметьте вариант алгоритма "Somewhat similar sequences (blastn)". 

Нажмите кнопку "BLAST". Дождитесь результата. 

Чтобы увидеть карту, нажмите плюсик рядом с "Dot matrix view".

Чтобы найти процент одинаковых остатков, в секции Alignments (выравнивания) посмотрите информацию над первым выравниванием. А именно, информацию такого вида:

Identities	
137102/146807(93%)	

Identities – совпадения букв в выравнивании; 137102 – число совпадений из 146807 – длины выравнивания. На карте каждое выравнивание соответствует диагонали. Какой именно – можно понять, т.к. координаты обоих фрагментов геномов указаны в самом выравнивании.

 Задание 2.
  * Используйте ссылку на базу Genomes из задания 1
  * Используйте Google
}}}