Генетический код является универсальным так как. Универсальный генетический код

К серии статей, описывающих происхождение ГК, можно относиться как к расследованию событий, о которых у нас осталось очень немало следов. Однако для понимания этих статей необходимо немного приложить усилий для вникания в молекулярные механизмы синтеза белка. Данная статья является вступительной для серии автопубликаций, посвященных возникновению генетического кода, и с неё лучше всего начинать знакомство с этой темой.
Обычно генетический код (ГК) определяют как способ (правило) кодирования белка на первичной структуре ДНК или РНК. В литературе чаще всего пишут, что это - однозначное соответствие последовательности из трёх нуклеотидов в гене одной аминокислоте в синтезируемом белке или месту окончания синтеза белка. Однако в таком определении есть две ошибки. При этом подразумеваются 20, так называемых канонических аминокислот, которые входят в состав белков всех без исключения живых организмов. Эти аминокислоты являются мономерами белка. Ошибки следующие:

1) Канонических аминокислот не 20, а только 19. Аминокислотой мы можем называть вещество, которое одновременно содержит аминогруппу -NH 2 и карбоксильную группу - COOH. Дело в том, что мономер белка - пролин - аминокислотой не является, поскольку в нём вместо аминогруппы присутствует иминогруппа, поэтому пролин правильней называть иминокислотой. Однако в дальнейшем во всех статьях, посвящённых ГК, для удобства я буду писать о 20 аминокислотах, подразумевая указанный ньюанс. Структуры аминокислоты приведены на рис. 1.

Рис. 1. Структуры канонических аминокислот. Аминокислоты имеют константные части, обозначенные на рисунке чёрным цветом, и вариабельные (или радикалы), обозначенные красным.

2) Соответствие аминокислот кодонам не всегда является однозначным. О нарушении случаев однозначности см. ниже.

Возникновение ГК означает возникновение кодируемого синтеза белка. Это событие является одним из ключевых для эволюционного формирования первых живых организмов.

Структура ГК представлена в круговой форме на рис. 2.



Рис. 2. Генетический код в круговой форме. Внутренний круг - первая буква кодона, второй круг - вторая буква кодона, третий круг - третья буква кодона, четвертый круг - обозначения аминокислот в трехбуквенном сокращении; П - полярные аминокислоты, НП - неполярные аминокислоты. Для наглядности симметрии важен избранный порядок символов U - C - A - G .

Итак, приступим к описанию основных свойств ГК.

1. Триплетность. Каждая аминокислота кодируется последовательностью из трёх нуклеотидов.

2. Наличие межгенных знаков препинания. К межгенным знакам препинания относятся последовательности нуклеиновой кислоты, на которых трансляци я начинается или заканчивается.

Трансляци я может начаться не с любого кодона, а только со строго определённого - стартового . К стартовому кодону относится триплет AUG , с которого начинается трансляци я. В этом случае этот триплет кодирует или метионин, или другую аминокислоту - формилметионин (у прокариот), который может включаться только в начале синтеза белка. В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х терминирующих кодонов , или стоп-сигналов : UAA, UAG, UGA. Они терминируют трансляци ю (так называется синтез белка на рибосоме).

3. Компактность, или отсутствие внутригенных знаков препинания. Внутри гена каждый нуклеотид входит в состав значащего кодона.

4. Неперекрываемость. Кодоны не перекрываются друг с другом, каждый имеет своё упорядочённое множестов нуклеотидов, которое не перекрывается с аналогичными множествами соседних кодонов.

5. Вырожденность. Обратное соответствие в направлении аминокислота-кодон неоднозначно. Это свойство называется вырожденностью. Серия - это множество кодонов, кодирующих одну аминокислоту, другими словами, это группа эквивалентных кодонов . Представим себе кодон в виде XYZ. Если XY определяет “смысл ” (т.е. аминокислоту), то кодон называется сильным . Если же для определения смысл а кодона нужен определенный Z, то такой кодон называется слабым .

Вырожденность кода тесно связана с неоднозначностью спаривания кодон-антикодон (под антикодоном подразумевается последовательность из трёх нуклеотидов на тРНК , которая может комплементарно спариваться с кодоном на матричной РНК (см. более подробно об этом две статьи: Молекулярные механизмы обеспечения вырожденности кода и Правило Лагерквиста. Физико-химическое обоснование симметрий и соотношений Румера ). Один антикодон на тРНК может узнавать отодного до трёх кодонов на мРНК.

6. Однозначность. Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляци и.

Известно три исключения.

Первое. У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.В начале гена формилметионин кодируется как обычным метиониновым кодоном AUG , так и ещё валиновым кодоном GUG или лейциновым UUG , которые внутри гена кодируют валин и лейцин, соответственно.

Во многих белках формилметионин отщепляется, либо удаляется формильная группа, в результате чего формилметионин превращается в обычный метионин.

Второе. В 1986 году сразу несколько групп исследователей обнаружили, что на мРНК терминирующий кодон UGA может кодировать селеноцистеин (см. рис. 3) при условии, что за ним следует особая последовательность нуклеотидов.

Рис. 3. Структура 21-й аминокислоты - селеноцистеина.

У E. coli (это латинское название кишечной палочки) селеноцистеил-тРНК в процессе трансляци и распознает в мРНК кодон UGA, но лишь в определенном контекст е: для узнавания UGA-кодона как осмысл енного важна последовательность длиной в 45 нуклеотидов, расположенная вслед за UGA-кодоном.

Рассмотренный пример показывает, что при необходимости живой организм может изменять смысл стандартного генетического кода. В этом случае генетическая информация, заключенная в генах, кодируется более сложным образом. Смысл кодона определяется в контекст е с определенной протяженной последовательностью нуклеотидов и при участии нескольких высокоспецифических белковых факторов. Важно, что селеноцистеиновая тРНК обнаружена в представителях всех трёх ветвей жизни (архей, эубактерий и эукариот), что указывает на древность происхождения селеноцистеинового синтеза, и возможно на присутствие его ещё в последнем универсальном общем предке (о нём речь пойдёт в других статьях). Скорей всего селеноцистеин встречается у всех без исключения живых организмов. Но в каждом отдельном организме селеноцистеин встречается не более, чем в паред есятков белков. Он входит в состав активных центров ферментов, в ряде гомологов которых на аналогичной позиции может функционировать обычный цистеин.

До недавнего времени считалось, что кодон UGA может считываться либо как селеноцистеин, либо кактерминальный, но недавно было показано, что у инфузории Euplotes кодон UGA кодирует или цистеин, илиселеноцистеин. См. " Генетический код допускает разночтения "

Третье исключение. У некоторых прокариот (5 видов архей и одной эубактерии - в Википедии информация сильно устарела) встречается особая кислота - пирролизин (рис. 4). Она кодируется триплетом UAG , который в каноническом коде служит терминатором трансляци и. Предполагается, что в этом случае, подобно случаю с кодированием селеноцистеина, считывание UAG как пирролизинового кодона происходит благодаря особой структуре на мРНК. Пирролизиновая тРНК содержит антикодон CTA и аминоацилируется АРСаз ой 2-го класса (про классификацию АРСаз см. статью "Кодазы помогают понять, как возник генетический код ").

UAG в качестве стоп-кодона используется редко, а если и используется, то часто за ним следует другой стоп-кодон.

Рис. 4. Структура 22-й аминокислоты пирролизина.

7. Универсальность. После того, как в середине 60-х годов прошлого века расшифровка ГК была завершена, долгое время считалось, что код одинаков во всех организмах, что указывает на единство происхождения всего живого на Земле.

Попробуем понять, почему ГК универсален. Дело в том, что если бы в организме изменилось хотя бы одно правило кодирования, то это привело бы к тому, что изменилась структура значительной части белков. Такое изменение было бы слишком кардинальным и поэтому практически всегда летальное, так как изменение смысл а только одного кодона может затронуть в среднем 1/64 часть всех аминокислотных последовательностей.

Отсюда следует одна очень важная мысль - ГК почти не менялся со времени своего формирования более 3,5 млрд. лет назад. А, значит, его структура несёт в себе след его возникновения, и анализ этой структуры может помочь понять, как именно мог возникнуть ГК.

В действительности ГК может несколько отличаться у бактерий, митохондрий, ядерный код некоторых инфузорий и дрожжей. Cейчас насчитывают не менее 17 генетических кодов, отличающихся от канонического на 1-5 кодонов Суммарно во всех известных вариантах отклонений от универсального ГК используются 18 различных замен смысл а кодона. Больше всего отклонений от стандартного кода известно у митохондрий - 10. Примечательно, что митохондрии позвоночных, плоских червей, иглокожих, кодируются разными кодами, а плесневых грибков, простейших и кишечнополостных - одним.

Эволюционная близость видов - отнюдь не гарант того, чтобы у них были сходные ГК. Генетические коды могут различаться даже у разных видов микоплазм (одни виды имеют канонический код, а другие - отличающиеся). Аналогичная ситуация наблюдается и для дрожжей.

Важно отметить, что митохондрии - потомки симбиотических организмов, которые приспособились жить внутри клеток. Они имеют сильно редуцированный геном , часть генов переселилась в ядро клетки. Поэтому изменения ГК в них становятся уже не столь кардинальными.

Обнаруженные позднее исключения представляют особый интерес с точки зрения эволюции, поскольку могу помочь пролить свет на механизмы эволюции кода.

Таблица 1.

Митохондриальные коды у различных организмов.

Кодон

Универсальный код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

UGA

STOP

Trp

Trp

Trp

STOP

AUA

Ile

Met

Met

Met

Ile

CUA

Leu

Leu

Leu

Thr

Leu

AGA

Arg

STOP

Ser

Arg

Arg

AGG

Arg

STOP

Ser

Arg

Arg

Три механизма смены аминокислоты, кодируемой кодом.

Первый - когда какой-то кодон не используется (или почти не используется) каким-то организмом в силу неравномерности встречаемости каких-то нуклеотидов (GC -состав), или комбинаций нуклеотидов. В результате такой кодон может вовсе исчезнуть из употребления (например, благодаря потере соответствующей тРНК ), а в дальнейшем может использоваться для кодирования другой аминокислоты без нанесения существенного ущерба организму. Этот механизм возможно отвечает за появление некоторых диалектов кодов у митохондрий.

Второй - превращение стоп-кодона в смысл овой. В этом случае часть у части транслируемых белков могут появиться дополнения. Однако ситуацию частично спасает то, что многие гены часто заканчиваются не одним, а двумя стоп-кодонами, поскольку возможны ошибки трансляци и, при которых стоп-кодоны считываются как аминокислоты.

Третий - возможно неоднозначное считывание определённых кодонов, как это имееют место у некоторых грибов.

8 . Связность. Группы эквивалентных кодонов (то есть кодонов, кодирующих одну и ту же аминокислоту) называются сериями . ГК содержит 21 серию, включая стоп-кодоны. В дальнейшем для определенности любая группа кодонов будет называться связной, если от каждого кодона этой группы можно перейти ко всем другим кодонам этой же группы путем последовательных замен нуклеотидов. Из 21 серии связны 18. 2 серии содержат по одному кодону, и лишь 1 серия для аминокислоты серин является несвязной и распадается на 2 две связные подсерии.


Рис. 5. Графы связности для некоторых кодовых серий. а - связная серия валина; б - связная серия лейцина; серия серина несвязная, распадается на две связных подсерии. Рисунок взят из статьи В.А. Ратнера " Генетический код как система ".

Свойство связности можно объяснить тем, что в период формирования ГК захватывал новые кодоны, которые минимально отличались от уже используемых.

9. Регулярность свойств аминокислот по корням триплетов. Все аминокислоты, кодируемые триплетами скорнем U, являются неполярными, не крайних свойств и размеров, имеюталифатические радикалы. Все триплеты с корнем C имеют сильные основы, ааминокислоты, кодируемые ими, имеют относительно малые размеры. Все триплеты с корнем A имеют слабые основы, кодируют полярные аминокислоты не малых размеров. Кодоны с корнем G характеризуются крайними и аномальнными вариантами аминокислот и серий. Они кодируют самую маленькую аминокислоту (глицин), самую длинную и плоскую (триптофан), самую длинную и «корявую» (аргинин), самую реактивную (цистеин), образует аномальную подсерию для серина.

10. Блочность. Универсальный ГК является «блоковым» кодом. Это означает, что аминокислоты со сходными физико-химическими свойствами, кодируются кодонами, отличающимися друг от друга одним основанием. Блочность кода хорошо видна на следующем рисунке.


Рис. 6. Блочная структура ГК. Белым цветом обозначены аминокислоты с алкильной группой.


Рис. 7. Цветовое представление физико-химических свойств аминокислот, основанное на значениях, описанных в кн книге Стайерса "Биохимия" . Слева - гидрофобность. Справа - способность к формированию альфа-спирали в белке. Красный, жёлтый и голубой цвета обозначают аминокислоты с большой, средней и малой гидрофобностью (слева) или соответствующей степенью способности к формированию альфа-спирали (справа).

Свойство блочности и регулярности также можно объяснить тем, что в период формирования ГК захватывал новые кодоны, которые минимально отличались от уже используемых.

Кодоны с одинаковыми первыми основаниями (приставками кодонов) кодируют аминокислоты с близкими путями биосинтеза . Кодоны аминокислот, принадлежащих к шикиматному , пируватному , аспартатному и глутаматному семействам, имеют в качестве приставок U, G, A и C, соответственно. О путях древнего биосинтеза аминокислот и его связи со свойствами современного кода см. "Древний дублетный генетический код был предопределён путями синтеза аминокислот ". На основе этих данных некоторые исследователи делают вывод о том, что на формирование кода большое влияние оказали биосинтетические взаимоотношения между аминокислотами . Однако сходство биосинтетических путей вовсе не означает сходство физико-химических свойств .

11. Помехоустойчивость. В самом общем виде помехоустойчивость ГК означает, что при случайных точковых мутациях и ошибках трансляци и не очень сильно меняются физико-химические свойства аминокислот.

Замена одного нуклеотида в триплете в большинстве случаев или не приводит к замене кодируемой аминокислоты, или приводит к замене на аминокислоту с той же полярностью.

Один из механизмов, обеспечивающих помехоустойчивость ГК - его вырожденность. Средняя вырожденность равна - число кодируемых сигналов/общее число кодонов, где к кодируемым сигналам относятся 20 аминокислот и знак терминации трансляци и. Усредненная вырожденность для всех аминокислот и знака терминации составляет три кодона на кодируемый сигнал.

Для того, чтобы количественно оценить помехоустойчивость, введём два понятия. Мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными. Мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными .

Каждый триплет допускает 9 однократных замен. Всего кодирующих аминокислоты триплетов 61. Поэтому количество возможных замен нуклеотидов для всех кодонов -

61 x 9 = 549. Из них:

23 замены нуклеотидов приводят к появлению стоп-кодонов.

134 замены не меняют кодируемую аминокислоту.
230 замен не меняют класс кодируемой аминокислоты.
162 замены приводят к смене класса аминокислоты, т.е. являются радикальными.
Из 183 замен 3-его нуклеотида, 7 приводят к появлению терминаторов трансляци и, а 176 - консервативны.
Из 183 замен 1-ого нуклеотида, 9 приводят к появлению терминаторов, 114 - консервативны и 60 - радикальны.
Из 183 замен 2-го нуклеотида, 7 приводят к появлению терминаторов, 74 -консервативны, 102 - радикальны.

На основе этих расчётов получим количественную оценку помехоустойчивости кода, как отношение числа консервативных замен к числу радикальных замен. Оно равно 364/162=2.25

При реальной оценке вклада вырожденности в помехоустойчивость необходимо учитывать частоту встречаемости аминокислот в белках, которая варьирует в разных видах.

В чем причина помехоустойчивости кода? Большинство исследователей считают, что это свойство является следствием селекции альтернативных ГК .

Стивен Фриленд и Лоренс Херст генерировали случайные такие коды и выясняли, что только один из ста альтернативных кодов обладает не меньшей помехоустойчивостью по сравнению с универсальным ГК.
Еще более интересный факт обнаружился, когда эти исследователи ввели дополнительное ограничение, с тем чтобы учесть реально существующие тенденции в характере мутирования ДНК и появлении ошибок при трансляци и. При таких условиях лучше канонического кода оказался ТОЛЬКО ОДИН КОД ИЗ МИЛЛИОНА ВОЗМОЖНЫХ.
Столь беспрецедентную жизнестойкость генетического кода проще всего объяснить тем, что он сформировался в результате естественного отбора. Возможно когда-то в биологическом мире существовало множество кодов, каждый со своей чувствительностью к ошибкам. Организм, лучше справлявшийся с ними, имел больше шансов выжить, и канонический код просто победил в борьбе за существование. Это предположение кажется вполне реальным - ведь мы знаем, что альтернативные коды действительно существуют. Подробнее о помехоустойчивости см. Закодированная эволюция (С.Фриленд, Л. Херст "Закодированная эволюция".//В мире науки. - 2004, №7).

В заключение, предлагаю посчитать число возможных генетических кодов, которые можно сгенерировать для 20 канонических аминокислот. Почему-то это число нигде мне не попадалось. Итак, нам необходимо, чтобы в генерируемых ГК были обязательно 20 аминокислот и стоп-сигнал, кодируемые ХОТЯ БЫ ОДНИМ КОДОНОМ.

Мысленно будем нумеровать кодоны в каком-то порядке. Рассуждать будем следующим образом. Если у нас имеется ровно 21 кодон, то тогда каждая аминокислота и стоп-сигнал будут занимать ровно по одному кодону. В этом случае возможных ГК будет 21!

Если будет 22 кодона, то появляется лишний кодон, который может иметь один из любых 21 смысл ов, причём этот кодон может располагаться на любом из 22 мест, тогда как остальные кодоны имеют ровно по одному разному смысл у, как и для случая 21 кодонов. Тогда получим число комбинаций 21!х(21х22).

Если кодонов будет 23, то рассуждая аналогично, получим, что 21 кодон имеют ровно по одному разных смысл ов (21! вариантов), а два кодона - по 21 разных смысл а (21 2 смысл ов при ФИКСИРОВАННОМ положении этих кодонов). Число различных положений для этих двух кодонов будет 23х22. Общее число вариантов ГК для 23 кодонов - 21!х21 2 х23х22

Если кодонов будет 24 - то число ГК будет равно 21!х21 3 х24х23х22,...

....................................................................................................................

Если кодонов будет 64, то число возможных ГК будет 21!х21 43 х64!/21! = 21 43 х64! ~ 9.1х10 145

Генетические функции ДНК заключаются в том, что она обеспечивает хранение, передачу и реализацию наследственной информации, которая представляет собой информацию о первичной структуре белков (т.е. их аминокислотном составе). Связь ДНК с синтезом белка была предсказана биохимиками Дж. Бидлом и Э. Тейтумом еще в 1944 г. при изучении механизма мутаций у плесневого грибка Neurospora. Информация записана в виде определенной последовательности азотистых оснований в молекуле ДНК с помощью генетического кода. Расшифровку генетического кода считают одним из великих открытий естествознания ХХ в. и по значимости приравнивают к открытию ядерной энергии в физике. Успех в этой области связан с именем американского ученого М. Ниренберга, в лаборатории которого был расшифрован первый кодон — YYY. Однако весь процесс расшифровки занял более 10 лет, в нем участвовало много известных ученых из разных стран, и не только биологи, но и физики, математики, кибернетики. Решающий вклад в разработку механизма записи генетической информации был внесен Г. Гамовым, который первым предположил, что кодон состоит из трех нуклеотидов. Совместными усилиями ученых была дана полная характеристика генетического кода.

Буквы во внутреннем круге — основания в 1-й позиции в кодоне, буквы во втором круге —
основания во 2-й позиции и буквы снаружи второго круга — основания в 3-й позиции.
В последнем круге — сокращенные названия аминокислот. НП — неполярные,
П — полярные аминокислотные остатки.

Основными свойствами генетического кода являются: триплетность , вырожденность и неперекрываемость . Триплетность означает, что последовательность из трех оснований определяет включение в молекулу белка специфической аминокислоты (например, АУГ — метионин). Вырожденность кода заключается в том, что одна и та же аминокислота может кодироваться двумя или несколькими кодонами. Неперекрываемость означает, что одно и то же основание не может входить в состав двух соседних кодонов.

Установлено, что код является универсальным , т.е. принцип записи генетической информации одинаков у всех организмов.

Триплеты, кодирующие одну и ту же аминокислоту, называются кодонами-синонимами. Обычно они имеют одинаковые основания в 1-й и 2-й позициях и различаются только по третьему основанию. Например, включение аминокислоты аланина в молекулу белка кодируют кодоны-синонимы в молекуле РНК — GCA, GCC, GCG, GCY. В составе генетического кода имеются три некодирующих триплета (нонсенс-кодоны — UAG, UGA, UAA), которые играют роль stop-сигналов в процессе считывания информации.

Установлено, что универсальность генетического кода не является абсолютной. При сохранении общего для всех организмов принципа кодирования и особенностей кода в ряде случаев наблюдается изменение смысловой нагрузки отдельных кодовых слов. Это явление получило название неоднозначности генетического кода, а сам код был назван квазиуниверсальным .

Читайте также другие статьи темы 6 "Молекулярные основы наследственности" :

Перейти к чтению других тем книги "Генетика и селекция. Теория. Задания. Ответы" .

Выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин , вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК . Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода .
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондирии млекопитающих, дрозофилы , S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

История представлений о генетическом коде

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

См. также

Примечания

  1. Genetic code supports targeted insertion of two amino acids by one codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 2009 Jan 9;323(5911):259-61.
  2. Кодон AUG кодирует метионин, но одновременно служит стартовым кодоном - с первого AUG-кодона мРНК как правило начинается трансляция.
  3. NCBI: «The Genetic Codes», Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell
  4. Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts. , Experientia. 1990 Dec 1;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (March 1992). «Recent evidence for evolution of the genetic code ». Microbiol. Rev. 56 (1): 229–64. PMID 1579111 .
  6. SANGER F. (1952). «The arrangement of amino acids in proteins.». Adv Protein Chem. 7 : 1-67. PMID 14933251 .
  7. М. Ичас Биологический код. - Мир, 1971.
  8. WATSON JD, CRICK FH. (April 1953). «Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.». Nature 171 : 737-738. PMID 13054692 .
  9. WATSON JD, CRICK FH. (May 1953). «Genetical implications of the structure of deoxyribonucleic acid.». Nature 171 : 964-967. PMID 13063483 .
  10. Crick FH. (April 1966). «The genetic code - yesterday, today, and tomorrow.». Cold Spring Harb Symp Quant Biol. : 1-9. PMID 5237190 .
  11. G. GAMOW (February 1954). «Possible Relation between Deoxyribonucleic Acid and Protein Structures.». Nature 173 : 318. DOI :10.1038/173318a0 . PMID 13882203 .
  12. GAMOW G, RICH A, YCAS M. (1956). «The problem of information transfer from the nucleic acids to proteins.». Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). «STATISTICAL CORRELATION OF PROTEIN AND RIBONUCLEIC ACID COMPOSITION. ». Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789 .
  14. Crick FH, Griffith JS, Orgel LE. (1957). «CODES WITHOUT COMMAS. ». Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032 .
  15. Hayes B. (1998). «The Invention of the Genetic Code.» (PDF reprint). American Scientist 86 : 8-14.

Литература

  • Азимов А. Генетический код. От теории эволюции до расшифровки ДНК. - М.: Центрполиграф, 2006. - 208 с - ISBN 5-9524-2230-6 .
  • Ратнер В. А.Генетический код как система - Соросовский образовательный журнал, 2000, 6, № 3, с.17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. General nature of the genetic code for proteins - Nature, 1961 (192), pp. 1227-32

Ссылки

  • Генетический код - статья из Большой советской энциклопедии

Wikimedia Foundation . 2010 .

Каждый живой организм обладает особым набором белков. Определенные соединения нуклеотидов и их последовательность в молекуле ДНК образуют генетический код. Он передает информацию о строении белка. В генетике была принята определенная концепция. Согласно ей, одному гену соответствовал один фермент (полипептид). Следует сказать, что исследования о нуклеиновых кислотах и белках проводились в течение достаточно продолжительного периода. Далее в статье подробнее рассмотрим генетический код и его свойства. Будет также приведена краткая хронология исследований.

Терминология

Генетический код - это способ зашифровки последовательности белков аминокислот с участием нуклеотидной последовательности. Этот метод формирования сведений характерен для всех живых организмов. Белки - природные органические вещества с высокой молекулярностью. Эти соединения также присутствуют в живых организмах. Они состоят из 20 видов аминокислот, которые называются каноническими. Аминокислоты выстроены в цепочку и соединены в строго установленной последовательности. Она определяет структуру белка и его биологические свойства. Встречается также несколько цепочек аминокислот в белке.

ДНК и РНК

Дезоксирибонуклеиновая кислота - это макромолекула. Она отвечает за передачу, хранение и реализацию наследственной информации. ДНК использует четыре азотистых основания. К ним относятся аденин, гуанин, цитозин, тимин. РНК состоит из тех же нуклеотидов, кроме того из них, в составе которого находится тимин. Вместо него присутствует нуклеотид, содержащий урацил (U). Молекулы РНК и ДНК представляют собой нуклеотидные цепочки. Благодаря такой структуре образовываются последовательности - "генетический алфавит".

Реализация информации

Синтез белка, который кодируется геном, реализовывается при помощи объединения мРНК на матрице ДНК (транскрипции). Также происходит передача генетического кода в последовательность аминокислот. То есть имеет место синтез полипептидной цепи на мРНК. Для зашифровки всех аминокислот и сигнала окончания белковой последовательности достаточно 3-х нуклеотидов. Эта цепь называется триплетом.

История исследования

Изучение белка и нуклеиновых кислот проводилось длительное время. В середине 20 века, наконец, появились первые идеи о том, какую природу имеет генетический код. В 1953 году выяснили, что некоторые белки состоят из последовательностей аминокислот. Правда, тогда еще не могли определить их точное количество, и по этому поводу велись многочисленные споры. В 1953 году авторами Уотсоном и Криком было опубликовано две работы. Первая заявляла о вторичной структуре ДНК, вторая говорила о ее допустимом копировании при помощи матричного синтеза. Кроме того, был сделан акцент на то, что конкретная последовательность оснований - это код, несущий наследственную информацию. Американский и советский физик Георгий Гамов допустил гипотезу кодирования и нашел метод ее проверки. В 1954 году была опубликована его работа, в ходе которой он выдвинул предложение установить соответствия между боковыми аминокислотными цепями и "дырами", имеющими ромбообразную форму, и использовать это как механизм кодирования. Потом его назвали ромбическим. Разъясняя свою работу, Гамов допустил, что генетический код может являться триплетным. Труд физика стал одним из первых среди тех, которые считались близкими к истине.

Классификация

По истечении нескольких лет предлагались различные модели генетических кодов, представляющие собой два вида: перекрывающиеся и неперекрывающиеся. В основе первой было вхождение одного нуклеотида в состав нескольких кодонов. К ней принадлежит треугольный, последовательный и мажорно-минорный генетический код. Вторая модель предполагает два вида. К неперекрывающимся относятся комбинационный и "код без запятых". В основе первого варианта лежит кодировка аминокислоты триплетами нуклеотидов, и главным является его состав. Согласно "коду без запятых", определенные триплеты соответствуют аминокислотам, а остальные нет. В этом случае считалось, что при расположении любых значащих триплетов последовательно другие, находящиеся в иной рамке считывания, получатся ненужными. Ученые полагали, что существует возможность подбора нуклеотидной последовательности, которая будет удовлетворять этим требованиям, и что триплетов ровно 20.

Хотя Гамов с соавторами ставили под сомнение такую модель, она считалась наиболее правильной на протяжении следующих пяти лет. В начале второй половины 20-го века появились новые данные, которые позволили обнаружить некоторые недочеты в "коде без запятых". Было выявлено, что кодоны способны провоцировать синтез белка в пробирке. Ближе к 1965 году осмыслили принцип всех 64 триплетов. В результате обнаружили избыточность некоторых кодонов. Другими словами, последовательность аминокислот кодируется несколькими триплетами.

Отличительные особенности

К свойствам генетического кода относятся:

Вариации

Впервые отклонение генетического кода от стандартного было обнаружено в 1979 году во время изучения генов митохондрий в организме человека. Далее выявили еще подобные варианты, в том числе множество альтернативных митохондриальных кодов. К ним относятся расшифровка стоп-кодона УГА, используемого в качестве определения триптофана у микоплазм. ГУГ и УУГ у архей и бактерий нередко применяются в роли стартовых вариантов. Иногда гены кодируют белок со старт-кодона, отличающийся от стандартно используемого этим видом. Кроме того, в некоторых белках селеноцистеин и пирролизин, которые являются нестандартными аминокислотами, вставляются рибосомой. Она прочитывает стоп-кодон. Это зависит от последовательностей, находящихся в мРНК. В настоящее время селеноцистеин считается 21-ой, пирролизан - 22-ой аминокислотой, присутствующей в составе белков.

Общие черты генетического кода

Однако все исключения являются редкостью. У живых организмов в основном генетический код имеет ряд общих признаков. К ним относятся состав кодона, в который входят три нуклеотида (два первых принадлежат к определяющим), передача кодонов тРНК и рибосомами в аминокислотную последовательность.

Лекция 5. Генетический код

Определение понятия

Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в ДНК.

Поскольку ДНК непосредственного участия в синтезе белка не принимает, то код записывается на языке РНК. В РНК вместо тимина входит урацил.

Свойства генетического кода

1. Триплетность

Каждая аминокислота кодируется последовательностью из 3-х нуклеотидов.

Определение: триплет или кодон - последовательность из трех нуклеотидов, кодирующая одну аминокислоту.

Код не может быть моноплетным, поскольку 4 (число разных нуклеотидов в ДНК) меньше 20. Код не может быть дуплетным, т.к. 16 (число сочетаний и перестановок из 4-х нуклеотидов по 2) меньше 20. Код может быть триплетным, т.к. 64 (число сочетаний и перестановок из 4-х по 3) больше 20.

2. Вырожденность.

Все аминокислоты, за исключением метионина и триптофана, кодируются более чем одним триплетом:

2 АК по 1 триплету = 2.

9 АК по 2 триплета = 18.

1 АК 3 триплета = 3.

5 АК по 4 триплета = 20.

3 АК по 6 триплетов = 18.

Всего 61 триплет кодирует 20 аминокислот.

3. Наличие межгенных знаков препинания.

Определение:

Ген - это участок ДНК, кодирующий одну полипептидную цепь или одну молекулу tPHK , r РНК или sPHK .

Гены tPHK , rPHK , sPHK белки не кодируют.

В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х триплетов, кодирующих терминирующие кодоны РНК, или стоп-сигналы. В мРНК они имеют следующий вид: UAA , UAG , UGA . Они терминируют (оканчивают) трансляцию.

Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. (См. лекцию 8) Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

4. Однозначность.

Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляции.

Исключение составляет кодон AUG . У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.

5. Компактность, или отсутствие внутригенных знаков препинания.
Внутри гена каждый нуклеотид входит в состав значащего кодона.

В 1961 г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его компактность.

Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида. Одиночная "+" или "-" мутация в начале гена портит весь ген. Двойная "+" или "-" мутация тоже портит весь ген.

Тройная "+" или "-" мутация в начале гена портит лишь его часть. Четверная "+" или "-" мутация опять портит весь ген.

Эксперимент доказывает, что код тршплетен и внутри гена нет знаков препинания. Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, кроме того, наличие знаков препинания между генами.

6. Универсальность.

Генетический код един для всех живущих на Земле существ.

В 1979 г. Беррел открыл идеальный код митохондрий человека.

Определение:

«Идеальным» называется генетический код, в котором выполняется правило вырожденности квазидублетного кода: Если в двух триплетах совпадают первые два нуклеотида, а третьи нуклеотиды относятся к одному классу (оба - пурины или оба - пиримидины), то эти триплеты кодируют одну и ту же аминокислоту.

Из этого правила в универсальном коде есть два исключения. Оба отклонения от идеального кода в универсальном касаются принципиальных моментов: начала и конца синтеза белка:

Кодон

Универсальный

код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

STOP

STOP

С UA

А G А

STOP

STOP

230 замен не меняют класс кодируемой аминокислоты. к рываемость.

В 1956 г. Георгий Гамов предложил вариант перекрываемого кода. Согласно Гамовскому коду, каждый нуклеотид, начиная с третьего в гене, входит в состав 3-х кодонов. Когда генетический код был расшифрован, оказалось, что он неперекрываем, т.е. каждый нуклеотид входит в состав лишь одного кодона.

Достоинства перекрываемого генетического кода: компактность, меньшая зависимость структуры белка от вставки или делеции нуклеотида.

Недостаток: большая зависимость структуры белка от замены нуклеотида и ограничение на соседей.

В 1976 г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D . Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D . Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

Информационная емкость ДНК

На Земле живет 6 миллиардов человек. Наследственная информация о них
заключена в 6x10 9 сперматозоидах. По разным оценкам у человека от 30 до 50
тысяч генов. У всех людей ~ 30x10 13 генов или 30x10 16 пар нуклеотидов, которые составляют 10 17 кодонов. Средняя книжная страница содержит 25x10 2 знаков. ДНК 6x10 9 сперматозоидов содержит информацию, равную по объему примерно

4x10 13 книжных страниц. Эти страницы заняли бы объем 6-и зданий НГУ. 6x10 9 сперматозоидов занимают половину наперстка. Их ДНК занимает менее четверти наперстка.



Просмотров