Кодоны синонимы днк

Статья на конкурс «био/мол/текст»: Аминокислота — «кирпичик» белковой последовательности — закодирована в геноме тремя нуклеотидами, при этом не всегда единственным образом. Здравый смысл подсказывает, что можно выбрать случайный триплет для данной аминокислоты и что от этого выбора ничего не зависит. Оказывается, здравый смысл в этом случае неправ.

Вместо предисловия

Науке известно некое обобщение, которое называют «центральной догмой молекулярной биологии». Это правило описывает поток информации на молекулярном уровне: от молекулы дезоксирибонуклеиновой кислоты (ДНК) к рибонуклеиновой кислоте (РНК) и затем к белку. Конечно же, можно привести множество уточнений, усложнений, оговорок и замечаний к этой упрощённой модели, но тем не менее, сформулированная Фрэнсисом Криком в далёком 1958 году, она по сей день является ключом к понимаю того, как «знание», закодированное в последовательности ДНК, превращается в функциональный белок.

Для работы с информацией, содержащейся в ДНК, принято отображать её в виде последовательности мономеров (нуклеотидов), составляющих одну из двух цепей ДНК: A (аденин), G (гуанин), C (цитозин) и T (тимин). Такое представление даёт возможность анализировать информацию, заключённую, например, в гене человеке, с помощью знакомых программистам алгоритмов и методов для работы со строковым типом данных.

Аналогичный алфавит был предложен для записи последовательности белковой молекулы, мономерами которой являются аминокислоты. Для обозначения каждой протеиногенной аминокислоты используется или трёхбуквенное обозначение (на основе первых букв названия аминокислоты, например Ser для серина), или однобуквенное обозначение, разработанное Маргарет Оакли Дэйхофф. Последнее видится вполне разумной оптимизацией: это позволяет в три раза сократить размер пространства, необходимого для хранения последовательности белка, и является более удобным с точки зрения работы с последовательностью как со строкой. Имея последовательность «кирпичиков» ДНК, можно попытаться предсказать, какие элементы — аминокислоты — будут составлять молекулу белка.

Синтез молекулы информационной РНК (мРНК) является первым шагом в рассматриваемой цепи передачи информации: в процессе транскрипции информация, закодированная в последовательности дезоксирибонуклетидов, позволяет получить последовательность рибонуклеиновой кислоты с помощью принципа комплементарности. Это означает, что «буквы» РНК будут соответствовать «буквам» в смысловой цепи ДНК (A → U, C → G, и т.д.).

Сама по себе мРНК является сложной молекулой. Её структура (наличие функциональных элементов) может подвергаться модификации и зависит в том числе от организма, о котором идёт речь (значительны различия между мРНК прокариот и эукариот, — например, наличие протяженных нетранслируемых участков в эукариотических мРНК, практически отсутсвующих у прокариотических). Для нашего дальнейшего анализа будем считать, что нам известна та последовательность мРНК, которая транслируется в последовательность белка. Этот этап передачи информации не похож на транскрипцию, где ключевым был принцип комплементарности: здесь кодирование и декодирование данных осуществляется иначе.

Экспрессия и некоторые факторы, влияющие на неё

Рисунок 1. Экспрессия и некоторые факторы, влияющие на неё

В качестве деталей для конструирования белков природа выбрала 20 аминокислот. (Здесь стоит отметить существование организмов, некоторые белки которых включают селеноцистеин (Sec) и пирролизин (Pyl). Работы о появлении, эволюции и эволюционном значении этих 21-й и 22-й протеиногенных аминокислот могут показаться интересными и, пожалуй, заслуживают отдельного разговора.) Отсюда возникает требование, вполне естественное и очевидное: для записи в геноме информации о последовательностях белков при таком числе аминокислот необходимо, чтобы одна аминокислота была «зашифрована» в виде как минимум трёх нуклеотидов . На самом деле, именно три нуклеотида (триплет, или кодон — от английского code) кодируют одну аминокислоту. Логическим следствием этой идеи является избыточность генетического кода. Однако с «лишними» 44 (43 − 20 = 44) кодонами можно было бы поступить разными способами: к примеру, не использовать их вовсе или дать возможность нескольким разным кодонам кодировать одну аминокислоту. Последний путь и был избран природой .

Стóит уточнить, что пытливые умы ученых уже создали искусственным путем систему, в которой рибосома при помощи набора «ортогональных» тРНК распознает уже не триплет, а квадруплет, т.е. переключается на кодирование аминокислот не по схеме 43=64, а 44=256: «Слово из четырёх букв» [11]. — Ред.

Возникновение генетического кода почти наверняка не было случайным. По одной из современных гипотез, существует определенное сродство между аминокислотами и кодирующими их триплетами. Возможно, такое сродство лежит в основе механизма матричного синтеза, который в своей первоначальной форме не включал таких «адапторов», какими являются транспортные РНК: «У истоков генетического кода: родственные души» [12]. — Ред.

Информация, содержащаяся в цепи мРНК, считывается по три нуклеотида аппаратом белкового синтеза, при этом важным фактом является свойство неперекрываемости: один нуклеотид входит в состав только одного триплета. Не лишним здесь будет замечание о существовании так называемых стоп-кодонов: считывание UAG, или UGA, или UAA с мРНК даёт сигнал к завершению процесса трансляции. Кстати, эти кодоны имеют красочные названия: янтарь, опал и охра (amber, opal и ochre).

Итак, получается, что изменение некоторых букв генома в определённых позициях не повлечёт за собой замены аминокислот соответствующего белка, которая могла бы сказаться на его свойствах или функции. Существуют даже четырёхкратно вырожденные сайты (fourfold degenerate sites): например, кодоны GGU, GGC, GGA и GGG соответствуют глицину.

«Стандартный» генетический код

Рисунок 2. «Стандартный» генетический код. Отмечены четырёхкратно вырожденные сайты. Аминокислоты отсортированы в алфавитном порядке согласно их латинским названиям.

Синонимы и… не синонимы

Замена буквы в кодоне, конечно, возможна не только в текстовом редакторе, но и в настоящей ДНК. Такие мутации в белок-кодирующих областях генома подразделяют на синонимичные и не синонимичные (некоторые предпочитают использовать синонимы этих слов — «синонимические» и «не синонимические»). Если первые не изменяют аминокислоту, соответствующую кодону, где произошла мутация, то не синонимичные мутации приводят к замене аминокислоты. Такую классификацию мутаций можно использовать для характеристики сайтов (позиций) кодона: например, для кодона CUG первая позиция является на 1/3 синонимичной (UUG, как и CUG, кодирует лейцин) и на 2/3 не синонимичной (AUG и GUG кодируют метионин и валин, соответственно).

Идея о равноценности кодонов, кодирующих одну аминокислоту (иногда их именуют синонимичными кодонами), кажется не противоречащей логике. Действительно, если взглянуть на проблему с высоты центральной догмы молекулярной биологии, то вполне разумно будет заявить об отсутствии эффекта синонимичных мутаций на последовательность белка, а значит и на функцию его в клетке и его эволюционную судьбу. Однако такая гипотеза явно не соответствует реальности: если подсчитать доли синонимичных кодонов в каком-нибудь известном геноме, то вычисленные частоты наверняка будут значимо различаться. Таким образом, налицо предпочтение одних синонимичных кодонов другим, что не имеет, на первый взгляд, никакого смысла. Этот феномен назвали смещением частоты кодонов (codon-usage bias, далее СЧК), и суть его заключается именно в статистическом отклонении использования синонимичных кодонов от равномерного.

Зачем клетке редкие и частые кодоны?

Причины СЧК так или иначе затронуты в десятках (и даже сотнях) публикаций, поэтому важно рассмотреть основные идеи, лежащие в основе различных гипотез. Определённые паттерны использования кодонов наблюдаются в геномах организмов, принадлежащих различным систематическим группам: бактерий, архей, червей, млекопитающих и т.д. Для объяснения наблюдаемых паттернов можно привлечь две классические модели. Первая из них предлагает связывать СЧК с мутационным процессом; так, можно искать объяснение СЧК в смещённых частотах нуклеотидов, рождаемых точечными мутациями или системами репарации. Эту модель можно назвать «нейтральной», в отличие от второй, которая привлекает к объяснению понятие естественного отбора и утверждает, что синонимичные мутации могут влиять на приспособленность организма. И нейтральный, и селективный механизм, вероятно, играют роль в создании той картины СЧК, которую можно наблюдать как между различными видами, так и в пределах одного генома между генами.

Рассмотрение СЧК для генов одного генома становится особенно интересным в свете следующего факта: уровень экспрессии генов в ряде видов положительно коррелирует со степенью СЧК. Вероятно, явление СЧК наиболее выражено в последовательностях генов с высокими уровнями экспрессии для повышения эффективности или точности трансляции. Это заявление стоит рассматривать как гипотезу, которая остаётся темой дискуссий и споров. Так, подобное объяснение не согласуется с представлением, что именно инициация (а не элонгация) является основным фактором, ограничивающим скорость синтеза белка в клетке (подробнее см. [1]).

СЧК может частично объясняться и другими факторами, например вторичной структурой мРНК. В качестве примера можно привести гены алкогольдегидрогеназы плодовой мухи: вторичная структура их мРНК более стабильна для генов с более низкими уровнями экспрессии. Предполагается, что отбор в пользу «сильной» вторичной структуры может использоваться для снижения уровня экспрессии гена и наоборот.

Ещё одним примером того, как синонимическая мутация может влиять на стабильность мРНК, являются мутации в гене дофаминового рецептора человека DRD2. В последовательности этого гена обнаружено 6 разных полиморфизмов (SNP, single nucleotide polymorphism, или «снипов», как их называют), но лишь одна мутация, уменьшающая время жизни молекулы мРНК, связана с нарушением экспрессии гена DRD2, которая регулируется дофамином [2]. Эта мутация — C957T, т. е. замена девятьсот пятьдесят седьмой буквы последовательности с C на T, — приводит к заметным изменениям в модели вторичной структуры мРНК. Кстати, интересно, что при сравнении частоты кодонов в последовательностях гена DRD2 и его «соседей» по хромосоме обнаружилось смещение в частоте использования нуклеотидов в третьей позиции кодонов гена DRD2 в пользу G и C.

Как известно, мРНК эукариот, будучи синтезированной, подвергается процессингу, а лишь затем транслируется. Сплайсинг РНК является одним из этапов процессинга и состоит в вырезании «ненужных» участков пре-мРНК — интронов. Оказывается, науке известно большое число заболеваний, связанных с нарушением процесса сплайсинга в результате синонимических мутаций. В их списке можно найти, например, синдром Марфана, фенилкетонурию и множественный склероз. Предполагается, что эти мутации могут создавать новые сайты сплайсинга или влиять на элементы последовательности, важные для контроля процесса сплайсинга (так называемые энхансеры и сайленсеры сплайсинга — exonic splicing enhancers and silencers). Наблюдаемые явления СЧК, таким образом, могут частично объясняться отбором, действующим на последовательности этих модуляторов сплайсинга.

Традиционно сплайсинг считается особенностью именно молекул РНК. Однако оказывается, что у белков тоже бывает сплайсинг, причем в этом случае процесс протекает спонтанно (то есть, автокаталитически): «Белки против РНК — кто первым придумал сплайсинг?» [13]. — Ред.

Любопытно, что даже в пределах одного гена выявлено явление СЧК. Например, возможно использование менее адаптированных (к набору изоакцепторных тРНК) кодонов в тех сайтах, где для правильной ко-трансляционной укладки белка необходима врéменная остановка рибосомы. Обнаружено также явление автокорреляции кодонов в последовательности гена, позволяющее, как предполагают авторы этого наблюдения, повысить эффективность элонгации посредством механизма повторного использования молекул тРНК, «недавно» задействованных в процессе трансляции.

В поисках оптимальных кодонов

Взаимосвязь между частотой использования кодона и количеств тРНК для некоторых генов

Рисунок 3. Взаимосвязь между частотой использования кодона и количеств тРНК для некоторых генов с сильным смещением использования кодонов от равномерного

Вполне естественной в свете всего вышесказанного выглядит идея организовать набор «хороших» кодонов, а заодно и определиться с критериями для этого. Согласно одной из теорий, преимущество таких кодонов перед их синонимичными собратьями заключается в оптимальной стабильности кодон-антикодонового взаимодействия: молекула тРНК будет оптимально подходить для кодона, если GC-состав (доля нуклеотидов G и C в последовательности) для такого взаимодействия будет промежуточным, т. е. находиться между экстремальными значениями слабых взаимодействий A—U (две водородные связи) и сильных пар G—C (три водородные связи). Однако такая теория не поддержана экспериментальными данными. Смещение частоты кодонов в сторону именно кодон-антикодоновых пар промежуточной стабильности не наблюдается, к тому же для разных организмов свойственны различные наборы «хороших» кодонов.

Но как же тогда природа выбирает оптимальные кодоны? Предполагают, что оптимизация эффективности трансляции возможна для любого выбранного кодона, например, с помощью подбора концентраций тРНК. В таком случае нет причин полагать, что свойства кодон-антикодоновых взаимодействий являются основой для выбора оптимальных кодонов.

Мухи и люди

Примечательно, что использование кодонов в геномах млекопитающих имеет много отличий в сравнении с другими таксонами. Различия использования кодонов между генами млекопитающих объясняются в первую очередь вариацией в GC-составе на уровне генома: оказывается, для генома млекопитающих свойственно наличие изохор — крупных (длиной >300 тысяч оснований) фрагментов хромосом, характеризующихся однородным GC-составом. При этом GC-состав между изохорами различается. Точнее всего предсказать нуклеотидный состав синонимичных сайтов и смещение частоты кодонов для определённого гена удаётся именно по нуклеотидному составу изохоры, которой этот ген принадлежит. Это можно считать подтверждением того, что отбор, действующий на гены или экзоны, не является главной движущей силой для синонимических мутаций.

Действие отбора на использование кодонов млекопитающими подвергается сомнению по теоретическим соображениям: эффективный размер популяции млекопитающих мал, что ограничивает эффективность отбора. В этой связи следует упомянуть теорию «почти нейтральных» мутаций. Если нейтральная теория предполагает скорость эволюции равной частоте нейтральных мутаций, то «почти нейтральная» теория основана на идее отрицательной корреляции между скоростью эволюции и эффективным размером популяции вида. Так, если негативный эффект s, оказываемый мутацией, невелик по сравнению с эффективным размером популяции Ne (s << 1/Ne), то её называют «эффективно нейтральной».Таким образом, мутация, «вредная» для плодовой мухи, может быть эффективно нейтральной для млекопитающих, так как для последних значение Ne много меньше. Поэтому предполагается маловероятным влияние естественного отбора на синонимические мутации для видов, популяции которых характеризуются Ne << 1 000 000, однако для некоторых биологических объектов, таких как бактерии и мухи, это влияние будет прослеживаться.

Уникальный серин

Давайте сделаем небольшое отступление и снова обратим взор на генетический код. Структура его такова, что лишь одна из аминокислот — серин — кодируется двумя наборами триплетов (TCN, где N — любое основание, и AGY, где Y — пиримидиновое основание, то есть C или T), для перехода между которыми недостаточно однонуклеотидной мутации. Так как вероятность одновременного мутирования двух позиций кодона считается малой, то предполагалось, что если остаток серина важен для функции белка, то соответствующий кодон будет «заперт» в одном из кодоновых семейств. Однако случаи «переключения» между этими кодоновыми семействами в кодирующих последовательностях были обнаружены, например, при изучении эволюции генов убиквитина — высококонсервативного белка, играющего ключевую роль в процессах деградации белков клетки [14], [15].

Было подсчитано, что если подобные переключения действительно имели место в эволюции, то происходили они с частотой, много превышающей частоту двух случайных мутаций в соседних сайтах. Так было предложено одно из возможных объяснений — динуклеотидные мутации. Другое объяснение не привлекает такие мутации, а основано на двух последовательных мутациях: «вредной», заменяющей сериновый кодон на треониновый (ACN) или цистеиновый (TGY), и «полезной», возвращающий серин «на место». При этом вторая мутация может привести к кодону другого семейства (AGY → ACY → TCY или TCY → TGY → AGY) или восстановить в последовательности прежний кодон. Эта гипотеза, однако, не отвечает на вопрос о том, как промежуточный (несериновый) кодон сохраняется в популяции.

Как взвесить тРНК?

Оптимальные кодоны для некоторых видов, в том числе для плодовой мухи Drosophila melanogaster и круглого червя Caenorhabditis elegans, соответствуют наиболее представленным тРНК, т.е. такие кодоны более всего адаптированы к набору изоакцепторных тРНК этих видов. Уместно отметить, что оценку количества тРНК можно производить по-разному. Наиболее прямой подход — использовать экспериментальные данные о количестве молекул тРНК в клетках ткани организма. Однако проведение таких экспериментов требует большого количества времени, материальных ресурсов и усилий исследователей. К счастью, есть способ косвенной оценки представленности тРНК: по количеству копий соответствующих генов в геноме интересующего организма. И хотя этот подход требует наличия последовательности всего генома, в наше время, когда количество данных полногеномного секвенирования возрастает экспоненциально, это вряд ли можно назвать проблемой [16–18].

Вычислительный аспект

Взгляд на феномен СЧК будет неполным, если не затронуть некоторые аспекты статистического и компьютерного анализа, связанные с тематикой вопроса. Так, необходимостью сравнения использования кодонов в последовательностях (разных генов и/или видов) продиктовано использование показателя RSCU (относительного использования синонимичных кодонов, the relative synonymous codon usage). RSCU может принимать значения от 0 (кодон отсутствует) до 6 (используется один кодон из 6 синонимичных). Если смещения частоты использования в семействе синонимичных кодонов не наблюдается, то значение RSCU равно единице. Формально RSCU определяют как отношение наблюдаемой частоты кодона к его частоте, ожидаемой в предположении равномерного использования синонимичных кодонов.

При вычислении RSCU игнорируются стоп-кодоны; для метионина и триптофана (каждую из этих аминокислот кодирует лишь один кодон) значение RSCU постоянно, поэтому RSCU для кодонов AUG и UGG также может быть опущено. Таким образом, для гена можно рассчитать RSCU по всем кодонам (так получится набор из 59 значений: 64 кодона − 3 стоп-кодона − 2 кодона [Met, Trp]). Если выполнить подобные вычисления для набора генов (например, некоторой выборки генов человека), можно изобразить полученные результаты в виде тепловой карты (рис. 4).

Относительное использование синонимичных кодонов

Рисунок 4. Относительное использование синонимичных кодонов (RSCU) для 50 случайно выбранных генов нескольких видов. Ясно прослеживается смещение частоты кодонов как в пределах одного генома, так и между геномами

На RSCU основано вычисление других показателей, например, относительной приспособленности кодона (w), которая вычисляется для определённых аминокислоты и кодона как отношение RSCU этого кодона к RSCU оптимального кодона для этой аминокислоты. Значение w позволяет получить индекс адаптации кодонов (the codon adaptation index, CAI), представляющий собой среднее геометрическое значений w для гена. Для Escherichia coli (кишечная палочка) было показано, что значения CAI генов рибосомных белков, как правило, высокие, в то время как для генов с низкими уровнями экспрессии характерны низкие значения CAI. Этот индекс может использоваться для предсказания уровней экспрессии генов определённого вида и гетерологичных генов (генов другого вида), сравнения использования кодонов разными организмами, идентификации рамок считывания, оценки скорости молекулярной эволюции или как мера адаптации использования кодонов в процессе эволюции (последнее представляет интерес, например, для вирусных генов).

Величины, используемые для оценки смещения частоты кодонов

Рисунок 5. Величины, используемые для оценки смещения частоты кодонов, и способы их вычисления

Стоит упомянуть также, такие способы оценки СЧК, как FOP (частота оптимальных кодонов, the frequency of optimal codons) и tAI (индекс адаптации к тРНК, the tRNA adaptation index). FOP представляет собой долю оптимальных кодонов среди всех кодонов гена. Как было показано для кишечной палочки, более высокие значения FOP присущи генам с высокими уровнями экспрессии. Создатели tAI, развивая идею CAI, предложили оценку адаптации гена к пулу тРНК организма. Индекс адаптации к тРНК учитывает число изоакцепторных тРНК для каждого кодона, число копий гена каждой тРНК, а также эффективность кодон-антикодоновых взаимодействий. Значение tAI коррелирует с уровнями экспрессии генов: наибольшие значения tAI принимает для высоко экспрессируемых генов.

Прикладное значение

По традиции, в завершение стоит обозначить применимость затронутых теоретических аспектов (что-то вроде «СЧК вокруг нас»). Во-первых, как уже было упомянуто, синонимические мутации и отбор, действующий на них, связаны с различными заболеваниями (их неполный список можно найти, например, в [4]). При этом во многих случаях точный механизм, по которому синонимические мутации приводят к аберрантному сплайсингу, вызывающему заболевания, ещё не известен. Итак, синонимические мутации могут иметь, если говорить более строгим языком, патофизиологическое и фармакогенетическое значение.

Второй областью, где можно встретить рассматриваемое явление, является искусственное СЧК. Основой его является возможность «подгонки» кодонного состава гена под использование кодонов интересующего организма. Например, такая «подгонка» позволила добиться лучших результатов в экспрессии зелёного флуоресцентного белка GFP в клетках человека. «Одомашненный» CЧК даёт надежду на возможность улучшения характеристик трансгенов — чужеродных молекул ДНК, внедряемых в клетку, — без изменения белка, кодируемого ими. В данном случае, как и на протяжении истории человечества, ответ на вопрос «А как это делает природа?» позволяет добиться практического результата «своими руками»: так, знание направления действия отбора на синонимические позиции в модуляторах сплайсинга позволяет увеличить время жизни транскрипта. Оптимизацию последовательности трансгена можно проводить in silico — методами компьютерного моделирования и анализа (например, см. [5]). На данный момент, однако, их применение ограничено видами, для которых хорошо изучены отклонения в концентрациях тРНК, такими как бактерии и дрожжи .

О том, что такое GFP и об их разнообразии см. в статье «Флуоресцентные белки: разнообразнее, чем вы думали!» [19]. — Ред.

Современные исследования показывают, что СЧК позволяет контролировать экспрессию генов не только на уровне трансляции, но также транскрипции. В последнем случае, СЧК позволяет модулировать специфичность взаимодействия ряда транскрипционных факторов с экзонными (кодирующими) участками генов: «Таинственный код нашего генома» [20]. — Ред.

  1. Joshua B. Plotkin, Grzegorz Kudla. (2011). Synonymous but not the same: the causes and consequences of codon bias. Nat Rev Genet. 12, 32-42;
  2. J. Duan. (2003). Synonymous mutations in the human dopamine receptor D2 (DRD2) affect mRNA stability and synthesis of the receptor. Human Molecular Genetics. 12, 205-216;
  3. Andersson S.G. and Kurland C.G. (1990). Codon preferences in free-living microorganisms. Microbiol. Rev. 54, 198–210;
  4. J. V. Chamary, Joanna L. Parmley, Laurence D. Hurst. (2006). Hearing silence: non-neutral evolution at synonymous sites in mammals. Nat Rev Genet. 7, 98-108;
  5. Mark Welch, Alan Villalobos, Claes Gustafsson, Jeremy Minshull. (2009). You’re one in a googol: optimizing genes for protein expression. J. R. Soc. Interface.. 6;
  6. Sharp P.M., Averof M., Lloyd A.T., Matassi G., Peden J.F. (1995). DNA sequence evolution: the sounds of silence. Philos. Trans. R. Soc. Lond. B. Biol. Sci. 349, 241-247;
  7. Paul M. Sharp, Wen-Hsiung Li. (1987). The codon adaptation index-a measure of directional synonymous codon usage bias, and its potential applications. Nucl Acids Res. 15, 1281-1295;
  8. Toshimichi Ikemura. (1981). Correlation between the abundance of Escherichia coli transfer RNAs and the occurrence of the respective codons in its protein genes: A proposal for a synonymous codon choice that is optimal for the E. coli translational system. Journal of Molecular Biology. 151, 389-409;
  9. M. d. Reis. (2004). Solving the riddle of codon usage preferences: a test for translational selection. Nucleic Acids Research. 32, 5036-5044;
  10. L Duret. (2002). Evolution of synonymous codon usage in metazoans. Current Opinion in Genetics & Development. 12, 640-649;
  11. Слово из четырёх букв;
  12. У истоков генетического кода: родственные души;
  13. Белки против РНК — кто первым придумал сплайсинг?;
  14. Вездесущий убиквитин;
  15. «Вездесущий убиквитин» возвращается;
  16. Код жизни: прочесть не значит понять;
  17. Перевалило за тысячу: третья фаза геномики человека;
  18. Технология: $1000 за геном;
  19. Флуоресцентные белки: разнообразнее, чем вы думали!;
  20. Таинственный код нашего генома.

    Г.К. называют вырожденным, поскольку 61 кодон кодирует всего 20 аминокислот. Поэтому почти каждой аминокислоте соответствует более чем один кодон. Вырожден-ность Г. к. неравномерна для аргинина, серина и лейцина она шестикратна (т.е. для каждой из этих аминокислот имеется по шесть кодонов), тогда как для мн. др. аминокислот (тирозина, гистидина, фенилаланина и др.) лишь двукратна. Две аминокислоты (метионин н триптофан) представлены единств, кодонами. Кодоны-синонимы почти всегда отличаются друг от друга по последнему из трех нуклеотидов, тогда как первые два совпадают. Т. обр., код аминокислоты определяется в осн. первыми двумя буквами . Вырожденность Г. к. имеет важное значение для повышения устойчивости генетич. информации. [c.519]

    От 20 до 50 ( ) различных видов молекул s-PHK — по числу смысловых кодонов или групп эквивалентных кодонов синонимов), соответствующих отдельным аминокислотам. Такой фонд молекул s-PHK представляет собой, по существу, генетический словарь , обеспечивающий переход от полинуклеотида к полипептиду в соответствии с кодом. [c.521]

    Таким образом, два вида бактерий, ДНК которых содержит одну и ту же информацию о последовательности аминокислот в белках, могут отличаться по содержанию [Г] + в ДНК на 33% только за счет исключительного использования того или иного из кодонов-синонимов. Разницу в содержании [Г] + [Ц] у бактерий более 33% следует относить на счет различной первичной структуры кодируемых белков. Как видно из табл. 27, более частое использование пролина, аргинина, аланина и глицина для построения белков соответствует более высокому содержанию [Г] + [Ц], тогда как в белках бактерий с более низким содержанием [Г]- -[Ц] следует ожидать более частой встречаемости фенилаланина, метионина, аспарагина, тирозина, изолейцина и лизина. Исследование суммарного аминокислотного состава белков разных видов бактерий подтвердило, что различное содержание [Г] + [Ц] в их ДНК может быть частично объяснено подобными различиями в первичной структуре белков. [c.441]

    Генетический код изображен на рис. 4.5. Отчетливо видно, что код-вырожденный 20 аминокислот представлены 61 кодоном. Почти каждой аминокислоте соответствует несколько кодонов-синонимов. Число кодонов для одной аминокислоты достаточно хорошо отражает частоту встречаемости данной аминокислоты в белках. Как видно на рис. 4.6, такая корреляция наблюдается для всех аминокислот, за исключением аргинина. [c.60]

    Шестьдесят один кодон соответствует аминокислотам, и все аминокислоты, за исключением триптофана и метионина, кодируются несколькими кодонами. Кодоны-синонимы обычно образуют группы, в которых два первых основания в кодоне являются общими, а третье-варьирует. Три кодона вызывают терминацию (ТЕРМ). Порядок оснований в кодоне записан, как обычно, в направлении от 5 -конца к З -концу. [c.60]

    Вырожден ли код Для кодирования 20 аминокислот достаточно 20 триплетных кодонов. Существуют ли кодоны-синонимы или остальные 44 кодона просто не имеют смысла  [c.393]

    На основании таблицы генетического кода можно построить последовательность из 30 нуклеотидов, определяющую последовательность 10 рассматриваемых аминокислот в лизоциме дикого типа с учетом того, что каждую данную аминокислоту может кодировать любой из ее кодонов-синонимов. Необходимо помнить, что порядок, в котором следует соединять кодоны при построении этой последовательности, будет зависеть от того, на каком из двух концов (3 — или 5 -) отрезка полинуклеотидной цепи находится кодон, определяющий аминоконцевую аминокислоту фрагмента белка лизоцима. Построенная нуклеотидная последовательность должна удовлетворять еще одному условию чтобы в случае выпадения (или включения) одного нуклеотида в кодоне левого серина и включения (выпадения) одного нуклеотида в кодоне левого аланина возникала новая гуклео- [c.446]

    Это условие резко ограничивает свободу выбора вариантов при построении полинуклеотидной последовательности оно не только позволяет выбрать, какой из кодонов-синонимов должен быть взят для каждой аминокислоты, но и указывает, в каком порядке должны быть расположены кодоны этот порядок должен соответствовать направлению трансляции информационной РНК от 5 — к З -концу. Это условие, кроме того, однозначно указывает, что две мутации сдвига фазы считывания представляют собой выпадение А из серинового кодона АГУ и включение Г между Г и Ц аланинового кодона ГЦ-. Еаинственно возможная нуклеотидная последовательность, которую можно построить с учетом этих условий, а также последовательность, возникающая в результате двух мутаций сдвига фазы считывания, представлены на фиг. 220. [c.447]

    После того как из первых опытов по расшифровке кода стало ясно, что код содержит кодоны-синонимы (например, как это видно из табл. 26, лейцин кодируется как УзЦ, так и УгП, возник вопрос, как происходит декодирование таких кодонов в ходе сборки полипептидов. Поскольку незадолго до этого в опытах по фракционированию экстрактов тРНК (подобных представленным на фиг. 208) было показано, что одной аминокислоте могут соответствовать несколько разных типов тРНК, казалось наиболее вероятным, что для каждого кодона существует соответствующая ему тРНК, несущая комплементарный антикодон. [c.447]

    Гипотеза неоднозначного соответствия объясняет, почему кодоны-синонимы находятся в одном квадрате кодовой таблицы. Согласно этой гипотезе, не может быть такой тРНК, которая узнавала бы только кодон, имеющий в третьем положении Ц или А. В соответствии с этим кодон типа ХУЦ должен быть синонимом кодона ХУУ. Поэтому, даже несмотря на то, что эта гипотеза допускает исключительное соответствие антикодона с V в третьем положении кодону с У в третьем положении, т. е. допускает существование тРНК, способной узнавать только кодон ХУУ, этот кодон не может определять аминокислоту, отличную от той, которая определяется кодоном ХУЦ. Аналогично кодон типа XYA должен иметь одно значение либо с ХУГ, либо с ХУУ и с ХУЦ. В этом случае, однако, исключительное соответствие антикодона с Ц в третьем положении кодону с Г в третьем положении указывает на существование тРНК, способной узнавать только кодон типа ХУГ следовательно, вполне возможно, что ХУГ может быть единственным кодоном для какой-нибудь аминокислоты. [c.449]

    Был получен Pho мутант Е. oti (дефектный по щелочной фосфатазе), содержащий ат-мутацию гене Phok. Из этого мутанта был получен набор Pho ревертантов, у которых восстановленне активности щелочной фосфатазы не было связано с действием супрессоров. Анализ аминокислотной последовательности белка щелочной фосфатазы этих ревертантов показал, что они содержат различные аминокислотные замены, показанные на схеме в том месте полипептидной цепи, где в белке дикого-типа находится остаток триптофана. Для каждой аминокислоты указаны ее кодоны-синонимы подчеркнуты те из них, которые связаны с УАГ одиночной заменой основания. Очевидно, что УАГ является единственным триплетом, из которого в результате одиночных замен может возникнуть хотя бы по одному кодону для каждой из семи аминокислот, обнаруженных в ревертантах. [c.456]

    Прямое доказательство универсальности кода было получено при сравнении последовательностей ДНК с со-ответствуюшими белковыми последовательностями. Оказалось, что во всех бактериальных и эукариотических геномах используются одни и те же наборы кодовых значений. Однако состав оснований различных геномов сильно варьирует в противоположность относительному постоянству аминокислотного состава белков. Можно думать поэтому, что различные виды используют различающиеся характерные наборы кодонов-синонимов. Действительно, наблюдаемое постоянство аминокислотного состава можно объяснить только вырожденностью генетического кода. [c.62]

    Обьгано акцепторами для одной и той же аминокислоты служат несколько разных тРПК (изоакцеп-торные тРПК) (рис. 3.30), имеющих разные антикодоны, что позволяет им спариваться с кодонами-синонимами. Отчасти этим объясняется и вырожденно сть кода, т.е. способность разных анти кодонов детерминировать одну и ту же аминокислоту. [c.138]


Таблицы соответствия кодонов мРНК и аминокислот

Генетический код — свойственный всем живым организмам способ кодирования последовательности аминокислотных остатков в составе белков при помощи последовательности нуклеотидов в составе нуклеиновой кислоты.

В ДНК используется четыре азотистых основания — аденин (А), гуанин (G), цитозин (С), тимин (T), которые в русскоязычной литературе обозначаются буквами А, Г, Ц и Т. Эти буквы составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением нуклеотида, содержащего тимин, который заменён похожим нуклеотидом, содержащим урацил, который обозначается буквой U (У в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

Реализация генетической информации в живых клетках (то есть синтез белка, кодируемого геном) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза мРНК на матрице ДНК) и трансляции генетического кода в аминокислотную последовательность (синтез полипептидной цепи на мРНК). Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трёх последовательных нуклеотидов. Набор из трёх нуклеотидов называется триплетом. Принятые сокращения, соответствующие аминокислотам и кодонам, изображены на рисунке. К последовательности триплетов (кодонов) в нуклеиновой кислоте, а, следовательно, и к последовательности аминокислотных остатков в белковой молекуле понятие «генетический код» не имеет отношения. Генетический код — это способ записи, а не содержание записи.

Генетический код, общий для большинства про- и эукариот. В таблице приведены все 64 кодона и указаны соответствующие аминокислоты. Порядок оснований — от 5′ к 3′ концу мРНК.

неполярный полярный основный кислотный (стоп-кодон)
Стандартный генетический код

1-е
основание
2-е основание 3-е
основание
U C A G
U UUU (Phe/F) Фенилаланин UCU (Ser/S) Серин UAU (Tyr/Y) Тирозин UGU (Cys/C) Цистеин U
UUC UCC UAC UGC C
UUA (Leu/L) Лейцин UCA UAA Стоп (Охра) UGA Стоп (Опал) A
UUG UCG UAG Стоп (Янтарь) UGG (Trp/W) Триптофан G
C CUU CCU (Pro/P) Пролин CAU (His/H) Гистидин CGU (Arg/R) Аргинин U
CUC CCC CAC CGC C
CUA CCA CAA (Gln/Q) Глутамин CGA A
CUG CCG CAG CGG G
A AUU (Ile/I) Изолейцин ACU (Thr/T) Треонин AAU (Asn/N) Аспарагин AGU (Ser/S) Серин U
AUC ACC AAC AGC C
AUA ACA AAA (Lys/K) Лизин AGA (Arg/R) Аргинин A
AUG[A] (Met/M) Метионин ACG AAG AGG G
G GUU (Val/V) Валин GCU (Ala/A) Аланин GAU (Asp/D) Аспарагиновая кислота GGU (Gly/G) Глицин U
GUC GCC GAC GGC C
GUA GCA GAA (Glu/E) Глутаминовая кислота GGA A
GUG GCG GAG GGG G
A  Кодон AUG кодирует метионин и одновременно является сайтом инициации трансляции: первый кодон AUG в кодирующей области мРНК служит началом синтеза белка.
Секторный вариант записи, внутренний круг — 1-е основание кодона (от 5′-конца)
Обратная таблица (указаны кодоны для каждой аминокислоты, а также стоп-кодоны)

Ala/A GCU, GCC, GCA, GCG Leu/L UUA, UUG, CUU, CUC, CUA, CUG
Arg/R CGU, CGC, CGA, CGG, AGA, AGG Lys/K AAA, AAG
Asn/N AAU, AAC Met/M AUG
Asp/D GAU, GAC Phe/F UUU, UUC
Cys/C UGU, UGC Pro/P CCU, CCC, CCA, CCG
Gln/Q CAA, CAG Ser/S UCU, UCC, UCA, UCG, AGU, AGC
Glu/E GAA, GAG Thr/T ACU, ACC, ACA, ACG
Gly/G GGU, GGC, GGA, GGG Trp/W UGG
His/H CAU, CAC Tyr/Y UAU, UAC
Ile/I AUU, AUC, AUA Val/V GUU, GUC, GUA, GUG
START AUG STOP UAG, UGA, UAA
Отклонения от стандартного генетического кода

Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Ядерный геном инфузории Euplotes UGA Стоп Цистеин или селеноцистеин
Митохондрии млекопитающих, дрозофилы, S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

Некоторые
аргументы в пользу вырожденности кода
содержатся в работе Ф. Крика с сотрудниками.
Взаимная супрессия мутаций типа «сдвиг
считывания», т. е. вставок и выпадений,
происходила на участке фагового гена,
соответствующем
приблизительно 1/10 всего гена. Ген rII
кодирует
белок, состоящий приблизительно из 200
аминокислотных остатков, и, следовательно,
мутации взаимодействовали на расстоянии,
достаточном для кодирования около 20
аминокислотных остатков. Если бы код
не был вырожденным, между вставкой и
выпадением с большой вероятностью
должны были возникать бессмысленные
триплеты, и тогда нормальное считывание
было бы невозможным. Прямые данные в
пользу вырожденности кода были получены
в экспериментах X. Виттмана, работавшего
с вирусом табачной мозаики (ВТМ), а также
при расшифровке кодонов химическим
путем.

В
1961 г.
на одном
из заседаний V Международного биохимического
конгресса в Москве М. Ниренберг и Дж.
Маттей сообщили о расшифровке первого
кодона и, что еще более важно, предложили
метод установления состава кодонов в
бесклеточной системе белкового синтеза.
Эксперименты по изучению бесклеточного
синтеза белка уже в течение ряда лет
велись несколькими группами биохимиков.

К
началу 60-х годов в этой области исследований
сложилась следующая ситуация.

При добавлении меченых аминокислот к
бесклеточным гомогенатам наблюдалось
включение радиоактивной метки в белки.
Добавление к таким гомогенатам ДНКазы
снижало, а добавление ДНК стимулировало
включение метки в белки. Это не
противоречило представлениям о роли
иРНК, переносящей информацию от ДНК к
рибосомам, на которых синтезируется
белок. Синтез белка в таких системах
происходил очень недолго. М. Ниренберг
и Дж. Маттей усовершенствовали бесклеточную
систему, сделав ее более стабильной, а
главное, показали, что она может работать
под контролем экзогенной РНК, естественной
или искусственной. Добавив синтетическую
полиуридиловую рибонуклеиновую кислоту
в бесклеточную систему, приготовленную
из Е. соli, они
обнаружили, что поли-и
стимулирует
включение в полипептид только одного
типа аминокислотных остатков –
фенилаланина. Таким образом, учитывая
триплетность генетического кода, кодон
для фенилаланина был расшифрован как
UUU в иРНК.

В
течение последующих трех-четырех лет
проблему генетического кода усиленно
исследовали с использованием бесклеточных
систем белкового синтеза, программируемого
так называемыми статистическими
сополимерами,
содержащими
рибонуклеотиды А, U, G, и С в разных
соотношениях. За это время в лаборатории
М. Ниренберга был выяснен состав
большинства кодонов. Однако определить
последовательность нуклеотидов в
кодонах этим способом было невозможно.

Последовательность
нуклеотидов в кодонах удалось определить
при помощи метода Г. Кораны с сотрудниками.
Они разработали метод химического
синтеза ДНК-подобных полимеров с заданной
последовательностью нуклеотидов.
Применяя такие полидезоксирибонуклеотиды
в качестве матрицы для синтеза РНК при
помощи ДНК-зависимой РНК-полимеразы,
можно было получить РНК с заранее
известной последовательностью и
использовать ее в бесклеточной системе
белкового синтеза.

В
результате в 1965 г., был составлен кодовый
словарь в его современном виде
.
Исследование мутаций, приводящих к
сдвигу считывания в ряде генов, кодирующих
первичную структуру белков (их называют
структурные
гены),
в
дальнейшем блестяще подтвердило
справедливость кодовой таблицы и
выводов, сделанных Ф. Криком на основе
генетического анализа кода.

Итак.
Генетический
код является триплетным, неперекрывающимся,
вырожденным, не имеет «запятых», т.е.
кодоны ничем не отделены друг
от
друга
. Он
считывается с фиксированной точки в
пределах гена в одном направлении. Код
универсален для всех живых организмов
(исключения: митохондриальные коды).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Кодо́н (кодирующий тринуклеотид) — единица генетического кода, тройка нуклеотидных остатков (триплет) в ДНК или РНК, обычно кодирующих включение одной аминокислоты. Последовательность кодонов в гене определяет последовательность аминокислот в полипептидной цепи белка, кодируемого этим геном.

Классификация

Поскольку существует 4 различных нуклеотида, то общее число кодонов равняется 64, из которых 61 кодируют определённые аминокислоты, а 3 оставшихся кодона (UGA, UAG и UAA) сигнализируют об остановке трансляции полипептидной цепи и называются стоп-кодонами. Кодон UAG в мРНК носит ещё название амбер-кодон (Amber), UGA — опал (Opal), а UAA — охра (Ochre). Стоп-кодоны выполняют важную функцию завершения (терминацию) сборки полипептидной цепи и также называются терминаторными кодонами. Некоторые из них вызывают обязательное прекращение синтеза, другие являются условными[1].

Кроме того, стоп-кодон, как кодон при котором не происходит включения аминокислоты в белок, ещё называют бессмысленным кодоном или нонсенс-кодоном.

Стартовым кодоном у эукариотических организмов является триплет AUG в мРНК, кодирующий метионин, с которого начинается образование полипептидной цепи в процессе трансляции. У некоторых прокариотов стартовыми кодонами так же являются GUG, AUU, CUG, UUG.

Так как в процессе биосинтеза белка в полипептидную цепь участвует всего 20 аминокислот, то различные кодоны могут кодировать одинаковые аминокислоты, такие кодоны принято называть изоакцепторными кодонами.

Таблица кодонов РНК

Таблица, отображающая 64 кодона и аминокислоты, соответствующие каждому из них.

1-е
основание
2-е основание
U,dT C,dC A,dA G,dG
U,dT

UUU (Phe/F) Фенилаланин
UUC (Phe/F) Фенилаланин
UUA (Leu/L) Лейцин
UUG (Leu/L) Лейцин

UCU (Ser/S) Серин
UCC (Ser/S) Серин
UCA (Ser/S) Серин
UCG (Ser/S) Серин

UAU (Tyr/Y) Тирозин
UAC (Tyr/Y) Тирозин
UAA Стоп-кодон (Ochre)
UAG Стоп-кодон (Amber)

UGU (Cys/C) Цистеин
UGC (Cys/C) Цистеин
UGA Стоп-кодон (Opal)
UGG (Trp/W) Триптофан

C,dC

CUU (Leu/L) Лейцин
CUC (Leu/L) Лейцин
CUA (Leu/L) Лейцин
CUG (Leu/L) Лейцин

CCU (Pro/P) Пролин
CCC (Pro/P) Пролин
CCA (Pro/P) Пролин
CCG (Pro/P) Пролин

CAU (His/H) Гистидин
CAC (His/H) Гистидин
CAA (Gln/Q) Глутамин
CAG (Gln/Q) Глутамин

CGU (Arg/R) Аргинин
CGC (Arg/R) Аргинин
CGA (Arg/R) Аргинин
CGG (Arg/R) Аргинин

A,dA

AUU (Ile/I) Изолейцин
AUC (Ile/I) Изолейцин
AUA (Ile/I) Изолейцин
AUG (Met/M) Метионин, Стартовый1

ACU (Thr/T) Треонин
ACC (Thr/T) Треонин
ACA (Thr/T) Треонин
ACG (Thr/T) Треонин

AAU (Asn/N) Аспарагин
AAC (Asn/N) Аспарагин
AAA (Lys/K) Лизин
AAG (Lys/K) Лизин

AGU (Ser/S) Серин
AGC (Ser/S) Серин
AGA (Arg/R) Аргинин
AGG (Arg/R) Аргинин

G,dG

GUU (Val/V) Валин
GUC (Val/V) Валин
GUA (Val/V) Валин
GUG (Val/V) Валин

GCU (Ala/A) Аланин
GCC (Ala/A) Аланин
GCA (Ala/A) Аланин
GCG (Ala/A) Аланин

GAU (Asp/D) Аспарагиновая кислота
GAC (Asp/D) Аспарагиновая кислота
GAA (Glu/E) Глутаминовая кислота
GAG (Glu/E) Глутаминовая кислота

GGU (Gly/G) Глицин
GGC (Gly/G) Глицин
GGA (Gly/G) Глицин
GGG (Gly/G) Глицин

Расшифровка завершена в 1966 году[1].

Неканонические значения кодонов

По крайней мере у 16 типов организмов генетический код отличается от канонического. Например многие виды зелёных водорослей Acetabularia транслируют стандартные стоп-кодоны UAG и UAA в аминокислоту глицин, а гриб Candida интерпретирует РНК-кодон CUG не как лейцин, а как серин. А у митохондрий пекарских дрожжей (Saccharomyces cerevisiae) четыре из шести кодонов, обычно транслирующихся в лейцин, кодируют треонин.

Существование таких вариаций свидетельствует о возможной эволюции генетического кода.

Представители почти всех трёх доменов живых организмов иногда прочитывают стандартный стоп-кодон UGA как 21-ю аминокислоту селеноцистеин, не относящуюся к 20 стандартным. Селеноцистеин образуется при химической модификации серина на стадии, когда последний ещё не отсоединился от тРНК в составе рибосомы.

Аналогично у представителей двух доменов (архебактерий и бактерий) стоп-кодон UAG прочитывается как 22-я аминокислота пирролизин.

Отличия от универсального кода имеются и в митохондриальной ДНК (см. раздел Особенности).

См. также

  • Антикодон
  • Терминаторный кодон

Примечания

  1. 1 2 Айала Ф. Д. Современная генетика. 1987.

Понравилась статья? Поделить с друзьями:
  • Кодла синонимы к слову
  • Кодифицированный это синоним
  • Кодифицированность синоним
  • Кодификатор синоним
  • Кодить синоним