Плазмиды

Плазмиды – это небольшие кольцевые двухцепочечные молекулы ДНК, которые участвуют в передаче наследственной информации у бактерий, архей и (очень редко) у эукариот [1]. Размеры плазмид от 537 до 2580080 пар нуклеотидов. Средняя длина плазмид 87614 пар нуклеотидов. Медиана длин равна 30673 пары нуклеотидов. Количество плазмид в разных родах довольно сильно отличается, возможно, это зависит от количества видов, входящих в род. Например в роде Thermotoga 2 плазмиды. Род Thermotoga официально содержит 9 видов [2]. Для сравнения в роде Bacillus около 217 видов [3] и 451 плазмида.
Таблица плазмид


Как извлекали род из названия организма?

С помощью функции UNICODE каждой строке поставили в соответствие номер первого символа этой строки в таблице UNICODE. Написали программу на Python. Данная программа печатает в файл строку, если ее символ – заглавная буква, если строка начинается с другого символа, то она заменяется на прочерк. Для определения первого символа строки используется как раз номер этого символа в таблице Юникод. Заглавные буквы имеют номера от 65 до 90, поэтому достаточно проверить попадает ли номер первого символа проверяемой строки в этот отрезок. Вы можете ознакомиться с текстом программы по ссылке.
Входные данные программы: текстовый файл с колонкой «#Organism/Name» и текстовый файл со списком номеров Юникод. Результатом работы программы является текстовый файл. Мы импортируем его в Excel. Разделителем между колонками является пробел. Тогда первая колонка – род, вторая – вид. Остаются еще две колонки с непонятными идентификаторами. Однако в списке есть "Candidatus", у них родовым названием является второе слово, соответственно третье слово – видовое название. Мы находим их с помощью поиска по тексту, выделяем (их совсем немного) и просто удаляем ячейки со сдвигом влево. Таким образом наша таблица соответствует требованиям.

Как составляли сводную таблицу по родам?

Во вкладке «Вставка» выбрали «Вставить сводную таблицу». В программе Excel написаны достаточно подробные инструкции. Следуя им мы выделили нужный нам столбец «Род», указали, что сводную таблицу нужно вставить на отдельный лист. На новом листе появилось прямоугольное поле. В меню справа выбрали поля для добавления в отчет (поставили галочку около «Род»), потом единственное выбранное поле перетащили в области «Строки» и «Значение». Программа создала таблицу.

Вернуться в раздел Excel


Использованные материалы:
[1]Wikipedia the Free Encyclopedia. Плазмиды
[2]Wikipedia the Free Encyclopedia. Thermotoga
[3]Wikipedia the Free Encyclopedia. Бациллы

Информация о плазмидах скачана с сайта NCBI