grep -n codon.*Pro ecoli.embl > proline.fastaОтчет о проделанной работе представлен в виде таблицы:
Аминокислотный остаток в 4-ой позиции белка ARGB_ECOLI | P - пролин |
Соответствующий кодон в гене argB | 5'-CCA-3'. Третья позиция, которую в данном случае занимает аденин (подчеркнут снизу), является вырожденной: для кодирования одной и той же аминокислоты может быть использованы все четыре варианта кодона: CCA, CCT, CCG, CCC. |
Идеальный антикодон | 5'-UGG-3' Этот антикодон в тРНК можно получить транскрибируя с матрицы 5'-CCA-3' расположенной в мРНК |
Ожидаемое количество тРНК для Pro, опираясь на генетически код | 4 что соответствует четырем вариантам кодона для пролина: CCA, CCT, CCC, CCG. |
количество разных тРНК для Pro, аннотированных в геноме E.Coli | для E.Coli аннотировано три различных тРНК: с антикодоном 5'-GGG-3' для соответствующего кодона 5'-CCY-3'. Где Y -(пиримидин в третьей позиции кодона) явно доказывает теорию качания, согласно которой G в антикодоне может узнавать как U, так и C (вообщем см. таблицу ниже) с неизвестным антикодоном. Кодон, для которого не определен антикодон, описан: это CCG, причем была определена Pro-тРНК. с антикодоном 5'-UGG-3' для соответствующего кодона 5'-CCD-3'. Где D - любое из A,U или G, но не C. Причина такого явления те же, что и с первой тРНК. Обсуждение приведено ниже. |
Характеристика выбранной для дальнейшего изучения тРНК: |
|
имя гена | proM |
локализация гена в геноме | locus_tag="b3799" 3980758..3980834 н.о. |
распознаваемый кодон | ССD |
антикодон | UGG |
Результат поиска всех пролиновых тРНК у Escherichia coli K-12 51785:FT /anticodon=(pos:2284267..2284269,aa:Pro) 83552:FT /anticodon=(pos:3706679..3706681,aa:Pro) 89820:FT /anticodon=(pos:3980792..3980794,aa:Pro) |
первое основание антикодона |
C |
A |
U |
G |
I |
третье основание кодона |
G |
U |
A или G |
U или C |
U,C или A |
Программа | FASTA | BLASTN | MegaBLAST | discontiguous MegaBLAST |
Длина якоря | 6 нуклеотидов | 11 нуклеотидов | 28 нуклеотидов | 11 нуклеотидов |
Результаты поиска | есть результаты fasta.fasta FASTA не использует индексные файлы, а реализует иной алгоритм, поэтому результат отличается от поисков с программами пакета BLAST. С помощью fasta34 нашёлся ген, правда не соответствуюший тРНК-пролина. Три других выравнивания не несут никакой ценности. | есть результаты blastn.fasta Классический алгоритм BLASTP, используемый данной программой пакета BLAST позволил найти три значимых участка в последовательности генома с одинаковыми значениями вероятностных и статистических характеристик (из них я привожу только один) | ничего не найдено | есть результаты discontigousmegablast.fasta Данная модификация программы MegaBlast с определенным способом заданными параметрами (см. ниже) позволила найти ТЕ ЖЕ результаты, что были получены программой BlastN!! причем с точностью до одного нуклеотидного основания. |
Число находок с E-value < 0,01 | 1 (полный геном) | 1 (полный геном) в том числе 3 релевантных участка | 1 (полный геном) в том числе 3 релевантных участка | |
Характеристика лучшей находки: | ||||
E-value | 4e-07 | 2e-11 (для всех трех участков) | 1e-11 (для всех трех участков) | |
длина выравнивания | 77 - соответствует длине последовательности моей тРНК. | 72 - построено локальное выравнивание в соответствии с алгоритмом | 75 - построено локальное выравнивание в соответствии с алгоритмом | |
вес выравнивания | 43.5 | 64 | 64 | |
координаты в геноме | 11463-11538 н.о. AL009126 | 166172-166243 н.о. AL009126 | 166243-166243 н.о. AL009126 | |
Аннотация лучшей находки по записи EMBL: | ||||
имя гена | trn0-Ile | trnI-Pro | trnI-Pro | |
это тРНК? | да | да | да | |
это тоже пролиновая тРНК? | нет | да | да |
Сравнение эффективности поисковых программ.