Генетический код, выраженный в кодонах, это система кодирования информации о строении белков, присущая всем живым организмам планеты. Его расшифровка заняла десятилетие, а вот то, что он существует, наука понимала почти столетие. Универсальность, специфичность, однонаправленность, а особенно вырожденность генетического кода имеют важное биологическое значение.

История открытий

Проблема кодирования всегда была ключевой в биологии. К матричному строению генетического кода наука продвигалась довольно неспешно. С момента обнаружения Дж. Уотсоном и Ф. Криком в 1953 году двойной спиральной структуры ДНК начался этап разгадывания самой структуры кода, который побудил веру в величие природы. Линейная структура белков и такая же структура ДНК подразумевала наличие генетического кода как соответствия двух текстов, но записанных при помощи разных алфавитов. И если алфавит белков был известен, то знаки ДНК стали предметом изучения биологов, физиков и математиков.

Нет смысла описывать все шаги в решении этой загадки. Прямой эксперимент, доказавший и подтвердивший, что между кодонами ДНК и аминокислотами белка существует четкая и последовательная соответственность, провели в 1964 году Ч. Яновски и С. Бреннер. А далее - период расшифровки генетического кода in vitro (в пробирке) с использованием техник синтеза белка в бесклеточных структурах.

Полностью расшифрованный код E. Coli был обнародован в 1966 году на симпозиуме биологов в Колд-Спринг-Харборе (США). Тогда и открылась избыточность (вырожденность) генетического кода. Что это значит, объяснилось довольно просто.

Раскодирование продолжается

Получение данных о расшифровке наследственного кода стало одним из самых значительных событий прошлого столетия. Сегодня наука продолжает углубленно исследовать механизмы молекулярных кодировок и его системных особенностей и переизбытка знаков, в чем выражается свойство вырожденности генетического кода. Отдельная отрасль изучения - возникновение и эволюционирование системы кодирования наследственного материала. Доказательства связи полинуклеотидов (ДНК) и полипептидов (белки) дали толчок развитию молекулярной биологии. А та, в свою очередь, биотехнологиям, биоинженерии, открытиям в селекции и растениеводстве.

Догмы и правила

Главная догма молекулярной биологии - информация передается с ДНК на информационную РНК, а после с нее на белок. В обратном направлении передача возможна с РНК на ДНК и с РНК на другую РНК.

Но матрицей или основой всегда остается ДНК. И все остальные фундаментальные особенности передачи информации - это отражение этого матричного характера передачи. А именно передачи путем осуществления синтеза на матрице других молекул, которые и станут структурой воспроизводства наследственной информации.

Генетический код

Линейное кодирование структуры белковых молекул осуществляется с помощью комплементарных кодонов (триплетов) нуклеотидов, которых всего 4 (адеин, гуанин, цитозин, тимин (урацил)), что спонтанно приводит к образованию другой цепочки нуклеотидов. Одинаковое число и химическая комплиментарность нуклеотидов - это главное условие такого синтеза. Но при образовании белковой молекулы качества соответствия количества и качества мономеров нет (ДНК нуклеотиды - аминокислоты белка). Это и есть природный наследственный код - система записи в последовательности нуклеотидов (кодонах) последовательности аминокислот в белке.

Генетический код обладает несколькими свойствами:

  • Триплетность.
  • Однозначность.
  • Направленность.
  • Неперекрываемость.
  • Избыточность (вырожденность) генетического кода.
  • Универсальность.

Приведем краткую характеристику, концентрируя внимание на биологическом значении.

Триплетность, непрерывность и наличие стоп-сигналов

Каждой из 61 аминокислоты соответствует один смысловой триплет (тройка) нуклеотидов. Три триплета не несут информацию об аминокислоте и являются стоп-кодонами. Каждый нуклеотид в цепочке входит в состав триплета, а не существует сам по себе. В конце и в начале цепочки нуклеотидов, отвечающих за один белок, находятся стоп-кодоны. Они запускают или останавливают трансляцию (синтез белковой молекулы).

Специфичность, неперекрываемость и однонаправленность

Каждый кодон (триплет) кодирует только одну аминокислоту. Каждый триплет не зависит от соседнего и не перекрывается. Один нуклеотид может входить только в один триплет в цепочке. Синтез белка идет всегда только в одном направлении, что регулируют стоп-кодоны.

Избыточности генетического кода

Каждый триплет нуклеотидов кодирует одну аминокислоту. Всего 64 нуклеотида, из них 61 - кодируют аминокислоты (смысловые кодоны), а три - бессмысленные, то есть аминокислоту не кодируют (стоп-кодоны). Избыточность (вырожденность) генетического кода заключается в том, что в каждом триплете могут быть произведены замены - радикальные (приводят к замене аминокислоты) и консервативные (не меняют класс аминокислоты). Легко посчитать, что если в триплете можно провести 9 замен (1, 2 и 3 позиция), каждый нуклеотид можно заменить на 4 - 1 = 3 других варианта, то общее количество возможных вариантов замен нуклеотида будет 61 по 9 = 549.

Вырожденность генетического кода проявляется в том, что 549 вариантов - это намного больше, чем необходимо для закодировки информации о 21 аминокислоте. При этом из 549 вариантов 23 замены приведут к образованию стоп-кодонов, 134 + 230 замены - консервативны, и 162 замены - радикальны.

Правило вырожденности и исключения

Если два кодона имеют два одинаковых первых нуклеотида, а оставшиеся представлены нуклеотидами одного класса (пуриновые или пиримидиновые), то они несут информацию об одной и той же аминокислоте. Это и есть правило вырожденности или избыточности генетического кода. Два исключения - АУА и УГА - первый кодирует метионин, хотя должен был бы изолейцин, а второй - стоп-кодон, хотя должен был бы кодировать триптофан.

Значение вырожденности и универсальности

Именно эти два свойства генетического кода имеют наибольшее биологическое значение. Все свойства, перечисленные выше, характерны для наследственной информации всех форм живых организмов на нашей планете.

Вырожденность генетического кода имеет приспособительное значение, как многократное дублирование кода одной аминокислоты. Кроме того, это означает снижение значимости (вырождение) третьего нуклеотида в кодоне. Такой вариант сводит к минимуму мутационные повреждения в ДНК, которые повлекут за собой грубые нарушения в структуре белка. Это защитный механизм живых организмов планеты.

Генетический код - это способ кодирования последовательности аминокислот в молекуле белка с помощью последовательности нуклеотидов в молекуле нуклеиновой кислоты. Свойства генетического кода вытекают из особенностей этого кодирования.

Каждой аминокислоте белка сопоставляется в соответствие три подряд идущих нуклеотида нуклеиновой кислоты - триплет , или кодон . Каждый из нуклеотидов может содержать одно из четырех азотистых оснований. В РНК это аденин (A), урацил (U), гуанин (G), цитозин (C). По-разному комбинируя азотистые основания (в данном случае содержащие их нуклеотиды) можно получить множество различных триплетов: AAA, GAU, UCC, GCA, AUC и т. д. Общее количество возможных комбинаций - 64, т. е. 4 3 .

В состав белков живых организмов входит около 20 аминокислот. Если бы природа «задумала» кодировать каждую аминокислоту не тремя, а двумя нуклеотидами, то разнообразия таких пар не хватило бы, так как их оказалось бы всего 16, т.е. 4 2 .

Таким образом, основное свойство генетического кода - его триплетность . Каждая аминокислота кодируется тройкой нуклеотидов.

Поскольку возможных разных триплетов существенно больше, чем используемых в биологических молекулах аминокислот, то в живой природе было реализовано такое свойство как избыточность генетического кода. Многие аминокислоты стали кодироваться не одним кодоном, а несколькими. Например, аминокислота глицин кодируется четырьмя различными кодонами: GGU, GGC, GGA, GGG. Избыточность также называют вырожденностью .

Соответствие между аминокислотами и кодонами отражают в виде таблиц. Например, таких:

По отношению к нуклеотидам генетический код обладает таким свойством как однозначность (или специфичность ): каждый кодон соответствует только одной аминокислоте. Например, кодоном GGU можно закодировать только глицин и больше никакую другую аминокислоту.

Еще раз. Избыточность - это про то, что несколько триплетов могут кодировать одну и ту же аминокислоту. Специфичность - каждый конкретный кодон может кодировать только одну аминокислоту.

В генетическом коде нет специальных знаков препинания (если не считать стоп-кодонов, обозначающих окончание синтеза полипептида). Функцию знаков препинания выполняют сами триплеты - окончание одного обозначает, что следом начнется другой. Отсюда следуют следующие два свойства генетического кода: непрерывность и неперекрываемость . Под непрерывность понимают считывание триплетов сразу друг за другом. Под неперекрываемостью - то, что каждый нуклеотид может входить в состав только одного триплета. Так первый нуклеотид следующего триплета всегда стоит после третьего нуклеотида предшествующего триплета. Кодон не может начаться со второго или третьего нуклеотида предшествующего кодона. Другими словами, код не перекрывается.

Генетический код обладает свойством универсальности . Он един для всех организмов на Земле, что говорит о единстве происхождения жизни. При этом встречаются очень редкие исключения. Например, некоторые триплеты митохондрий и хлоропластов кодируют другие, а не обычные для них, аминокислоты. Это может говорить о том, что на заре развития жизни существовали немного различные вариации генетического кода.

Наконец, генетический код обладает помехоустойчивостью , которая является следствием такого его свойства как избыточность. Точечные мутации , иногда происходящие в ДНК , обычно приводят к замене одного азотистого основания на другое. При этом изменяется триплет. Например, было AAA, после мутации стало AAG. Однако подобные изменения не всегда приводят к изменению аминокислоты в синтезируемом полипептиде, так как оба триплета из-за свойства избыточности генетического кода могут соответствовать одной аминокислоте. Учитывая, что мутации чаще вредны, свойство помехоустойчивости полезно.

ГЕНЕТИЧЕСКИЙ КОД (греч, genetikos относящийся к происхождению; син.: код, биологический код, аминокислотный код, белковый код, код нуклеиновых к-т ) - система записи наследственной информации в молекулах нуклеиновых кислот животных, растений, бактерий и вирусов чередованием последовательности нуклеотидов.

Генетическая информация (рис.) из клетки в клетку, из поколения в поколение, за исключением РНК-содержащих вирусов, передается путем редупликации молекул ДНК (см. Репликация). Реализация наследственной информации ДНК в процессе жизнедеятельности клетки осуществляется через 3 типа РНК: информационную (иРНК или мРНК), рибосомную (рРНК) и транспортную (тРНК), которые с помощью фермента РНК-полимеразы синтезируются на ДНК как на матрице. При этом последовательность нуклеотидов в молекуле ДНК однозначно определяет последовательность нуклеотидов во всех трех типах РНК (см. Транскрипция). Информацию гена (см.), кодирующего белковую молекулу, несет только иРНК. Конечным продуктом реализации наследственной информации является синтез белковых молекул, специфичность которых определяется последовательностью входящих в них аминокислот (см. Трансляция).

Поскольку в составе ДНК или РНК представлено только по 4 разных азотистых основания [в ДНК - аденин (А), тимин (Т), гуанин (Г), цитозин (Ц); в РНК - аденин (А), урацил (У), цитозин (Ц), гуанин (Г)], последовательность которых определяет последовательность 20 аминокислот в составе белка, возникает проблема Г. к., т. е. проблема перевода 4-буквенного алфавита нуклеиновых к-т в 20-буквенный алфавит полипептидов.

Впервые идея матричного синтеза белковых молекул с правильным предсказанием свойств гипотетической матрицы была сформулирована Н. К. Кольцовым в 1928 г. В 1944 г. Эйвери (О. Avery) с соавт, установил, что за передачу наследственных признаков при трансформации у пневмококков ответственны молекулы ДНК. В 1948 г. Чаргафф (E. Chargaff) показал, что во всех молекулах ДНК имеет место количественное равенство соответствующих нуклеотидов (А-T, Г-Ц). В 1953 г. Ф. Крик, Дж. Уотсон и Уилкинс (М. H. F. Wilkins), исходя из этого правила и данных рентгеноструктурного анализа (см.), пришли к выводу, что молекул а ДНК представляет собой двойную спираль, состоящую из двух полинуклеотидных нитей, соединенных между собой водородными связями. Причем против А одной цепи во второй может находиться только Т, против Г - только Ц. Эта комплементарность приводит к тому, что последовательность нуклеотидов одной цепи однозначно определяет последовательность другой. Второй существенный вывод, вытекающий из этой модели,- молекула ДНК способна к самовоспроизведению.

В 1954 г. Гамов (G. Gamow) сформулировал проблему Г. к. в ее современном виде. В 1957 г. Ф. Крик высказал Гипотезу адаптера, предположив, что аминокислоты взаимодействуют с нуклеиновой к-той не непосредственно, а через посредников (теперь известных под названием тРНК). В ближайшие после этого годы все принципиальные звенья общей схемы передачи генетической информации, вначале гипотетичные, были подтверждены экспериментально. В 1957 г. были открыты иРНК [А. С. Спирин, А. Н. Белозерский с соавт.; Фолькин и Астрахан (E. Volkin, L. Astrachan)] и тРНК [Хоугленд (М. В. Hoagland)]; в 1960 г. синтезирована ДНК вне клетки с использованием в качестве матрицы существующих макромолекул ДНК (А. Корнберг) и открыт ДНК-зависимый синтез РНК [Вейсс (S. В. Weiss) с соавт.]. В 1961 г. была создана бесклеточная система, в к-рой в присутствии естественной РНК или синтетических полирибонуклеотидов осуществлялся синтез белковоподобных веществ [М. Ниренберг и Маттеи (J. H. Matthaei)]. Проблема познания Г. к. состояла из исследования общих свойств кода и собственно его расшифровки, т. е. выяснения, какие комбинации нуклеотидов (кодоны) кодируют определенные аминокислоты.

Общие свойства кода были выяснены независимо от его расшифровки и в основном до нее путем анализа молекулярных закономерностей образования мутаций (Ф. Крик и соавт., 1961; Н. В. Лучник, 1963). Они сводятся к следующему:

1. Код универсален, т. е. идентичен, по крайней мере в основном, для всех живых существ.

2. Код триплетен, т. е. каждая аминокислота кодируется тройкой нуклеотидов.

3. Код неперекрывающийся, т. е. данный нуклеотид не может входить в состав более чем одного кодона.

4. Код вырожден, т. е. одна аминокислота может кодироваться несколькими триплетами.

5. Информация о первичной структуре белка считывается с иРНК последовательно, начиная с фиксированной точки.

6. Большинство возможных триплетов имеет «смысл», т. е. кодирует аминокислоты.

7. Из трех «букв» кодона преимущественное значение имеют лишь две (облигатные), третья же (факультативная) несет значительно меньшую информацию.

Прямая расшифровка кода состояла бы в сравнении последовательности нуклеотидов в структурном гене (или синтезированной на нем иРНК) с последовательностью аминокислот в соответствующем белке. Однако такой путь пока технически невозможен. Были применены два других пути: синтез белка в бесклеточной системе с использованием в качестве матрицы искусственных полирибонуклеотидов известного состава и анализ молекулярных закономерностей образования мутаций (см.). Первый принес положительные результаты раньше и исторически сыграл в расшифровке Г. к. большую роль.

В 1961 г. М. Ниренберг и Маттеи применили в качестве матрицы гомо-полимер - синтетическую полиуридиловую к-ту (т. е. искусственную РНК состава УУУУ...) и получили полифенилаланин. Из этого следовало, что кодон фенилаланина состоит из нескольких У, т. е. в случае триплетного кода расшифровывается как УУУ. Позже наряду с гомополимерами были использованы полирибонуклеотиды, состоявшие из разных нуклеотидов. При этом был известен только состав полимеров, расположение же нуклеотидов в них было статистическим, поэтому и анализ результатов был статистическим и давал косвенные выводы. Довольно быстро удалось найти хотя бы по одному триплету для всех 20 аминокислот. Выяснилось, что присутствие органических растворителей, изменение pH или температуры, некоторые катионы и особенно антибиотики делают код неоднозначным: те же кодоны начинают стимулировать включение других аминокислот, в некоторых случаях один кодон начинал кодировать до четырех разных аминокислот. Стрептомицин влиял на считывание информации как в бесклеточных системах, так и in vivo, причем был эффективен только на стрептомицинчувствительных штаммах бактерий. У стрептомицинзависимых штаммов он «исправлял» считывание с кодонов, изменившихся в результате мутации. Подобные результаты давали основание сомневаться в правильности расшифровки Г. к. с помощью бесклеточной системы; требовалось подтверждение, и в первую очередь данными in vivo.

Основные данные о Г. к. in vivo получены при анализе аминокислотного состава белков у организмов, обработанных мутагенами (см.) с известным механизмом действия, напр, азотистой к-той, к-рая вызывает в молекуле ДНК замену Ц на У и А на Г. Полезную информацию дают также анализ мутаций, вызванных неспецифическими мутагенами, сравнение различий в первичной структуре родственных белков у разных видов, корреляция между составом ДНК и белков и т. п.

Расшифровка Г. к. на основании данных in vivo и in vitro дала совпадающие результаты. Позже были разработаны три других метода расшифровки кода в бесклеточных системах: связывание аминоацил-тРНК (т. е. тРНК с присоединенной активированной аминокислотой) тринуклеотидами известного состава (М. Ниренберг и соавт., 1965), связывание аминоацил-тРНК полинуклеотидами, начинающимися с определенного триплета (Маттеи с соавт., 1966), и использование в качестве иРНК полимеров, в которых известен не только состав, но и порядок нуклеотидов (X. Корана и соавт., 1965). Все три метода дополняют друг друга, а результаты находятся в соответствии с данными, полученными в опытах in vivo.

В 70-х гг. 20 в. появились методы особенно надежной проверки результатов расшифровки Г. к. Известно, что мутации, возникающие под действием профлавина, состоят в выпадении или вставке отдельных нуклеотидов, что приводит к сдвигу рамки считывания. У фага Т4 был вызван профлавином ряд мутаций, при которых изменился состав лизоцима. Этот состав был проанализирован и сопоставлен с теми кодонами, которые должны были получиться при сдвиге рамки считывания. Получилось полное соответствие. Дополнительно этот метод позволил установить, какие именно триплеты вырожденного кода кодируют каждую из аминокислот. В 1970 г. Адамсу (J. М. Adams) с сотрудниками удалось провести частичную расшифровку Г. к. прямым методом: у фага R17 определили последовательность оснований во фрагменте длиной в 57 нуклеотидов и сравнили с аминокислотной последовательностью белка его оболочки. Результаты полностью совпали с полученными менее прямыми методами. Т. о., код расшифрован полностью и верно.

Результаты расшифровки сведены в таблицу. В ней указан состав кодонов и РНК. Состав антикодонов тРНК комплементарен кодонам иРНК, т. е. вместо У в них находится А, вместо А - У, вместо Ц - Г и вместо Г - Ц, и соответствует кодонам структурного гена (той нити ДНК, с к-рой считывается информация) с той лишь разницей, что место тимина занимает урацил. Из 64 триплетов, которые могут быть образованы сочетанием 4 нуклеотидов, 61 имеет «смысл», т. е. кодирует аминокислоты, а 3 являются «нонсенсами» (лишенными смысла). Между составом триплетов и их смыслом имеется довольно четкая зависимость, к-рая была обнаружена еще при анализе общих свойств кода. В ряде случаев триплеты, кодирующие определенную аминокислоту (напр., пролин, аланин), характеризуются тем, что два первых нуклеотида (облигатные) у них одинаковы, а третий (факультативный) может быть любым. В других случаях (при кодировании, напр., аспарагина, глутамина) один и тот же смысл имеют два сходных триплета, у которых совпадают два первых нуклеотида, а на месте третьего стоит любой пурин или любой пиримидин.

Нонсенс-кодоны, 2 из которых имеют специальные названия, соответствующие обозначению фаговых мутантов (УАА-охра, УАГ-амбер, УГА-опал), хотя и не кодируют каких-либо аминокислот, но имеют большое значение при считывании информации, кодируя конец полипептидной цепи.

Считывание информации происходит в направлении от 5 1 -> 3 1 - к концу нуклеотидной цепи (см. Дезоксирибонуклеиновые кислоты). При этом синтез белка идет от аминокислоты со свободной аминогруппой к аминокислоте со свободной карбоксильной группой. Начало синтеза кодируется триплетами АУГ и ГУГ, которые в этом случае включают специфичную стартовую аминоацил-тРНК, а именно N-формилметио-нил-тРНК. Эти же триплеты при локализации внутри цепи кодируют соответственно метионин и валин. Неоднозначность снимается тем, что началу считывания предшествует нонсенс. Есть данные, говорящие в пользу того, что граница между участками иРНК, кодирующими разные белки, состоит более чем из двух триплетов и что в этих местах меняется вторичная структура РНК; этот вопрос находится в стадии исследования. Если нонсенс-кодон возникает внутри структурного гена, то соответствующий белок строится только до места расположения этого кодона.

Открытие и расшифровка генетического кода - выдающееся достижение молекулярной биологии - оказало влияние на все биол, науки, положив в ряде случаев начало развитию специальных крупных разделов (см. Молекулярная генетика). Эффект открытия Г. к. и связанных с ним исследований сравнивают с тем эффектом, который оказала на биол, науки теория Дарвина.

Универсальность Г. к. является прямым доказательством универсальности основных молекулярных механизмов жизни у всех представителей органического мира. Между тем большие различия в функциях генетического аппарата и его строении при переходе от прокариотов к эукариотам и от одноклеточных к многоклеточным, вероятно, связаны и с молекулярными различиями, исследование которых - одна из задач будущего. Поскольку исследования Г. к.- дело лишь последних лет, значение полученных результатов для практической медицины носит лишь Косвенный характер, позволяя пока понять природу заболеваний, механизм действия возбудителей болезней и лекарственных веществ. Однако открытие таких явлений, как трансформация (см.), трансдукция (см.), супрессия (см.), указывает на принципиальную возможность исправления патологически измененной наследственной информации или ее коррекции - так наз. генная инженерия (см.).

Таблица. ГЕНЕТИЧЕСКИЙ КОД

Первый нуклеотид кодона

Второй нуклеотид кодона

Третий, нуклеотид кодона

Фенилаланин

J Нонсенс

Триптофан

Гистидин

Глутаминовая кислота

Изолейцин

Аспарагиновая

Метионин

Аспарагин

Глутамин

* Кодирует конец цепи.

** Кодирует также начало цепи.

Библиография: Ичас М. Биологический код, пер. с англ., М., 1971; Лучник Н.Б. Биофизика цитогенетических поражений и генетический код, Л., 1968; Молекулярная генетика, пер. с англ., под ред. А. Н. Белозерского, ч. 1, М., 1964; Нуклеиновые кислоты, пер. с англ., под ред. А. Н. Белозерского, М., 1965; Уотсон Дж. Д. Молекулярная биология гена, пер. с англ., М., 1967; Физиологическая генетика, под ред. М. Е. Лобашева С. Г., Инге-Вечтомо-ва, Л., 1976, библиогр.; Desoxyribonuc-leins&ure, Schlttssel des Lebens, hrsg. v„ E. Geissler, B., 1972; The genetic code, Gold Spr. Harb. Symp. quant. Biol., v. 31, 1966; W o e s e C. R. The genetic code, N. Y. a. o., 1967.

Ведущий научный журнал Nature сообщил об обнаружении второго генетического кода – такого себе «кода внутри кода», который был недавно взломан молекулярными биологами и компьютерными программистами. Более того, для того чтобы его выявить, они использовали не эволюционную теорию, а информационные технологии.

Новый код получил название Код Сплайсинга. Он находится внутри ДНК. Этот код контролирует основной генетический код очень сложным, однако, предсказуемым образом. Код сплайсинга управляет тем, как и когда происходит сборка генов и регулирующих элементов. Раскрытие этого кода внутри кода помогает пролить свет на некоторые давнишние тайны генетики, которые всплыли на поверхность после проведения Проекта по расшифровке полной последовательности генома человека. Одна из таких тайн заключалась в том, почему в таком сложном организме, как человеческий, существует всего лишь 20 000 генов? (Ученые ожидали обнаружить намного больше.) Почему гены разбиваются на сегменты (экзоны), которые разделяются некодирующими элементами (интроны), а затем после транскрипции соединяются вместе (т.е. сплайсируются)? И почему гены включаются в одних клетках и тканях, и не включаются в других? На протяжении двух десятилетий молекулярные биологи пытались выяснить механизмы генетической регуляции. Эта статья указывает на очень важный момент в понимании того, что происходит на самом деле. Она не дает ответы на все вопросы, но она демонстрирует, что внутренний код существует. Этот код – система передачи информации, которую можно так понятно расшифровать, что ученые могли бы прогнозировать, как в определенных ситуациях и с необъяснимой точностью может вести себя геном.

Представьте, что в соседней комнате вы слышите оркестр. Вы открываете дверь, заглядываете внутрь и видите в комнате трех или четырех музыкантов, играющих на музыкальных инструментах. Это то, на что, по словам Брендона Фрея, участвовавшего в раскрытии кода, похож человеческий геном. Он говорит: «Мы смогли обнаружить только 20,000 генов, но мы знали, что они образуют огромное количество белковых продуктов и регулирующих элементов. Как? Один из методов называется альтернативным сплайсингом» . Различные экзоны (части генов) могут собираться разными способами. «Например, три гена белка нейрексина могут создавать более 3000 генетических посланий, которые помогают управлять системой связей мозга» , - говорит Фрей. Тут же в статье говорится о том, что ученым известно, что 95% наших генов имеют альтернативный сплайсинг, и в большинстве случаев в разных типах клеток и тканей транскрипты (молекулы РНК, образующиеся в результате транскрипции) экспрессируются по-разному. Должно быть что-то, что управляет тем, как собираются и экспрессируются эти тысячи комбинаций. В этом и состоит задача Кода Сплайсинга.

Читатели, которые хотят получить беглый обзор открытия, могут прочитать статью в Science Daily под названием «Исследователи, взломавшие ‘Код сплайсинга’, раскрывают тайну, лежащую в основе биологической сложности» . В статье говорится: «Ученые из университета Торонто получили фундаментально новое представление о том, как живые клетки используют ограниченное число генов для образования таких невероятно сложных органов, как мозг» . Сам журнал Nature начинается со статьи Хейди Ледфорда «Код внутри кода». Затем последовала статья Техедора и Валькарсела под названием «Регуляция генов: взлом второго генетического кода. И, наконец, решающей стала статья группы исследователей из университета Торонто под руководством Бенджамина Д. Бленкоу и Брендона Д. Фрея, «Расшифровывая код сплайсинга».

Эта статья – победа информационной науки, которая напоминает нам дешифровальщиков времен Второй Мировой Войны. Их методы включали алгебру, геометрию, теорию вероятностей, векторное исчисление, теорию информации, оптимизацию кода программы, и другие передовые методы. В чем они не нуждались, так это в эволюционной теории , которая никогда не упоминалась в научных статьях. Читая эту статью, можно увидеть, под каким сильным напряжением находятся авторы этой увертюры:

«Мы описываем схему ‘кода сплайсинга’, в которой используются комбинации сотен свойств РНК для того, чтобы предсказать обусловленные тканями изменения в альтернативном сплайсинге тысячи экзонов. Код устанавливает новые классы схем сплайсинга, распознает разные регулирующие программы в разных тканях и устанавливает контролируемые мутациями регулирующие последовательности. Мы раскрыли широко распространенные регулирующие стратегии, включая: использование непредвиденно крупных объединений свойств; выявление низких уровней включения экзона, которые ослабляются свойствами специфических тканей; проявление свойств в интронах глубже, чем считалось раньше; и модуляция уровней сплайс-варианта структурными характеристиками транскрипта. Код помог установить класс экзонов, включение которых заглушает экспрессию в тканях взрослого организма, активируя деградацию мРНКа, и исключение которых способствует экспрессии во время эмбриогенеза. Код облегчает раскрытие и детальное описание регулируемых событий альтернативного сплайсинга в масштабах всего генома».

В команде, взломавшей код, участвовали специалисты с кафедры электронной и вычислительной техники, а также с кафедры молекулярной генетики. (Сам же Фрей работает в подразделении корпорации Microsoft, Microsoft Research) Подобно дешифровальщикам прошлого времени, Фрей и Бараш разработали «новый метод биологического анализа, проводимого с помощью компьютера, который обнаруживает ‘кодовые слова’, запрятанные внутри генома» . С помощью огромного количества данных, созданных молекулярными генетиками, группа исследователей проводила «обратную разработку» кода сплайсинга до тех пор, пока они не смогли предсказать, как он будет действовать . Как только исследователи с этим справились, они проверили этот код на мутациях и увидели, как вставляются или удаляются экзоны. Они обнаружили, что код даже может вызывать тканеспецифические изменения или действовать по-разному в зависимости от того, взрослая это мышь или эмбрион. Один ген, Xpo4, связан с раком; исследователи отметили: «Эти данные подтверждают вывод о том, что экспрессия Xpo4 гена должна строго контролироваться во избежание возможных губительных последствий, включая онкогенез (рак), так как он активен во время эмбриогенеза, но его количество снижено в тканях взрослого организма. Оказывается, что они были абсолютно удивлены уровнем контроля, который они увидели. Намеренно или нет, но в качестве ключа к разгадке Фрей использовал не случайную изменчивость и отбор, а язык разумного замысла. Он отметил: «Понимание сложной биологической системы подобно пониманию сложной электронной схемы».

Хейди Ледфорд сказал, что кажущаяся простота генетического кода Уотсона-Крика, с его четырьмя основаниями, триплетными кодонами, 20 аминокислотами и 64 «символами» ДНК – скрывает под собой целый мир сложности . Заключенный внутри этого более простого кода, Код сплайсинга намного сложнее.

Но между ДНК и белками находится РНК – отдельный мир сложности. РНК – это трансформер, который иногда переносит генетические послания, а иногда управляет ими, задействуя при этом множество структур, способных влиять на его функцию. В статье, опубликованной в этом же выпуске, группа исследователей под руководством Бенджамина Д. Бленкоу и Брендона Д. Фрея из университета Торонто в Онтарио, Канада, сообщает о попытках разгадать второй генетический код, который может предсказывать, как сегменты информационной РНК, транскрибированные с определенного гена, могут смешиваться и сочетаться, чтобы образовывать разнообразные продукты в разных тканях. Это процесс известен как альтернативный сплайсинг. На этот раз нет никакой простой таблицы – вместо неё алгоритмы, которые объединяют более чем 200 различных свойств ДНК с определениями структуры РНК.

Работа этих исследователей указывает на быстрый прогресс, которого достигли вычислительные методы в составлении модели РНК. В дополнение к пониманию альтернативного сплайсинга, информатика помогает ученым предсказывать структуры РНК и устанавливать маленькие регулирующие фрагменты РНК, которые не кодируют протеины. «Это замечательное время» , - говорит Кристофер Берг, компьютерный биолог из массачусетского института технологий в Кембридже. «В будущем нас ждёт огромный успех» .

Информатика, компьютерная биология, алгоритмы и коды – эти концепции не были частью дарвиновского словаря, когда он разрабатывал свою теорию. У Менделя была очень упрощенная модель того, как распределяются признаки во время унаследования. К тому же, идея о том, что признаки кодируются, была представлена только в 1953 году. Мы видим, что исходный генетический код регулируется еще более сложным, включенным в него, кодом. Это революционные идеи . К тому же есть все признаки того, что этот уровень контроля не последний . Ледфорд напоминает нам, что например, РНК и белки имеют трехмерную структуру. Функции молекул могут изменяться, когда изменяется их форма Должно существовать что-то, что контролирует складывание, так что трехмерная структура выполняет то, что требует функция. К тому же, доступ к генам, по-видимому, контролируется другим кодом, гистоновым кодом . Этот код закодирован молекулярными маркерами или «хвостами» на гистоновых белках, которые служат центрами для скручивания и суперскручивания ДНК. Описывая наше время, Ледфорд говорит о «постоянном возрождении в информатике РНК» .

Техедор и Валькарсел согласны с тем, что за простотой кроется сложность. «По идее все выглядит очень просто: ДНК образует РНК, которая затем создает белок» , - начинают они свою статью. «Но в реальности всё намного сложнее» . В 1950-х годах мы узнали о том, что все живые организмы, от бактерий до человека, имеют основной генетический код. Но вскоре мы поняли, что сложные организмы (эукариоты) обладают каким-то неестественным и трудным для понимания свойством: их геномы имеют своеобразные участки, интроны, которые должны удаляться, чтобы экзоны могли соединиться вместе. Почему? Сегодня туман рассеивается: «Основное преимущество этого механизма заключается в том, что он позволяет разным клеткам выбирать альтернативные способы сплайсинга предшественника матричной РНК (пре-мРНК) и таким образом один ген образует различные послания», - объясняют они, - «а затем различные мРНК могут кодировать разные белки с различными функциями» . Из меньшего кода вы получаете больше информации, при условии, что внутри кода есть этот другой код, который знает, как это сделать.

Что и делает взлом кода сплайсинга настолько трудным, так это то, что факторы, контролирующие сборку экзонов, устанавливаются множеством других факторов: последовательностями, расположенными рядом с границами экзона, последовательностями интронов и регулирующими факторами, которые либо помогают, либо тормозят механизм сплайсинга. К тому же, «воздействия определенной последовательности или фактора могут изменяться в зависимости от её расположения относительно границ интрона-экзона или других регуляторных мотивов» , - поясняют Техедор и Валькарсел. «Поэтому самой сложной задачей в предсказании тканеспецифического сплайсинга является вычисление алгебры несметного числа мотивов и взаимоотношений между регуляторными факторами, которые их распознают» .

Для разрешения этой проблемы группа исследователей ввела в компьютер огромное количество данных о последовательностях РНК и условиях, в которых они образовались. «Затем компьютеру было дано задание - определить комбинацию свойств, которые лучше всего могли бы объяснить экспериментально установленный тканеспецифический отбор экзонов» . Другими словами, исследователи провели обратную разработку кода. Подобно дешифровальщикам времен Второй Мировой Войны, как только ученые узнают алгоритм, они могут делать предсказания: «Он правильно и с точностью установил альтернативные экзоны и предсказал их дифференциальное регулирование между парами типов тканей». И так же как любая хорошая научная теория, открытие дало новое понимание: «Это позволило нам по-новому объяснить ранее установленные регуляторные мотивы и указало на ранее неизвестные свойства известных регуляторов, а также неожиданные функциональные связи между ними» , - отметили исследователи. «Например, код подразумевает, что включение экзонов, ведущее к процессированным белкам, является общим механизмом управления процессом экспрессии генов во время перехода из эмбриональной ткани в ткань взрослого организма» .

Техедор и Валькарсел считают публикацию их статьи важным первым шагом: «Работу... лучше рассматривать как открытие первого фрагмента гораздо более крупного Розеттского камня, необходимого для расшифровки альтернативных сообщений нашего генома». По словам этих ученых, будущие исследования, несомненно, улучшат их знания об этом новом коде. В заключение своей статьи они вскользь упоминают эволюцию, и делают это очень необычным образом. Они говорят: «Это не значит, что эволюция создала эти коды. Это означает, что прогресс будет требовать понимания того, как коды взаимодействуют. Другой неожиданностью стало то, что наблюдаемая на сегодня степень сохранения поднимает вопрос о возможном существовании «видоспецифичных кодов» .

Код, вероятно, работает в каждой отдельной клетке и, поэтому, возможно должен отвечать более чем за 200 типов клеток млекопитающих животных. Также он должен справляться с огромным разнообразием схем альтернативного сплайсинга, не говоря уже о простых решениях о включении или пропуске отдельного экзона. Ограниченное эволюционное сохранение регулирования альтернативного сплайсинга (который по подсчетам составляет около 20% между людьми и мышами) поднимает вопрос о существовании видоспецифичных кодов. Более того, связь между процессингом ДНК и транскрипцией генов влияет на альтернативный сплайсинг, и последние данные указывают на упаковку ДНК гистоновыми белками и ковалентными модификациями гистонов (так называемый эпигенетический код) в регуляции сплайсинга. Поэтому будущим методам предстоит установить точное взаимодействие между гистоновым кодом и кодом сплайсинга. То же самое касается еще мало понимаемого влияния сложных структур РНК на альтернативный сплайсинг.

Коды, коды и снова коды. То, что ученые практически ничего не говорят о дарвинизме в этих статьях, указывает на то, что эволюционным теоретикам – приверженцам старых идей и традиций, предстоит много над чем поразмышлять после того, как они прочтут эти статьи. А вот те, кто с восторженностью относится к биологии кодов, окажутся на передовой. У них есть замечательная возможность воспользоваться увлекательным веб-приложением, которое дешифровщики создали для того, чтобы стимулировать проведение дальнейшего исследования. Его можно найти на сайте университета Торонто под названием «Веб-сайт прогнозирования альтернативного сплайсинга». Посетители напрасно будут искать здесь упоминания об эволюции, и это несмотря на старую аксиому, что ничего в биологии не имеет без неё смысла. Новая версия этого выражения 2010 года может звучать так: «Ничто в биологии не имеет смысла, если не рассматривается в свете информатики» .

Ссылки и примечания

Мы рады, что смогли рассказать вам об этой истории в день её публикации. Возможно, это одна из наиболее значимых научных статей года. (Конечно же, значимым является каждое большое открытие, сделанное другими группами ученых, как открытие Уотсона и Крика.) Единственное, что мы можем сказать на это: «Вот это да!» Это открытие – замечательное подтверждение Сотворения по замыслу и огромный вызов дарвиновской империи. Интересно, как эволюционисты попытаются исправить свою упрощенную историю случайных мутаций и естественного отбора, которая была придумана еще в 19 столетии, в свете этих новых данных.

Вы поняли, о чем говорят Техедор и Валькарсел? Виды могут иметь свой собственный код, свойственный только этим видам. «Поэтому будущим методам предстоит установить точное взаимодействие между гистоновым [эпигенетическим] кодом и кодом сплайсинга», - отмечают они. В переводе это означает: «Дарвинисты здесь не причем. Они просто не способны с этим справиться». Если простой генетический код Уотсона-Крика был проблемой для дарвинистов, то, что они скажут теперь о коде сплайсинга, который из одних и тех же генов создает тысячи транскриптов? А как они справятся с эпигенетическим кодом, который управляет экспрессией генов? И кто знает, может в этом невероятном «взаимодействии», о котором мы только начинаем узнавать, задействованы и другие коды, напоминающие Розеттский камень, только начинающий показываться из песка?

Теперь, когда мы размышляем о кодах и информатике, мы начинаем думать о разных парадигмах нового исследования. Что если геном частично действует как сеть хранения данных? Что если в нем имеет место криптография или происходят алгоритмы сжатия? Нам следует вспомнить о современных информационных системах и технологиях хранения информации. Может быть, мы даже обнаружим элементы стеганографии. Несомненно, существуют дополнительные механизмы устойчивости, такие как дублирования и исправления, которые возможно помогут объяснить существование псевдогенов. Копирования всего генома могут быть реакциями на стресс. Некоторые из этих явлений могут оказаться полезными показателями исторических событий, которые не имеют ничего общего с универсальным общим предком, но помогают исследовать сравнительную геномику в рамках информатики и дизайна устойчивости, а также помогают понять причину заболевания.

Эволюционисты оказываются в сильном затруднении. Исследователи попытались видоизменить код, а получили только рак и мутации. Как они собираются пройти по полю приспособленности, если оно всё заминировано катастрофами, ждущими своего часа, как только кто-то начинает вмешиваться в эти неразрывно связанные коды? Мы знаем, что существует некая встроенная устойчивость и переносимость, но вся картина представляет собой невероятно сложную, разработанную, оптимизированную информационную систему , а не беспорядочное соединение частей, которыми можно бесконечно играться. Вся идея кода является концепцией разумного замысла.

A. E. Уайлдер-Смит придавал этому особое значение. Код предполагает соглашение между двумя частями. Соглашение – это заблаговременное согласие. Оно подразумевает планирование и цель. Символ SOS, как сказал бы Уайлдер-Смит, мы используем по соглашению как сигнал бедствия. SOS не выглядит как бедствие. Оно не пахнет как бедствие. Оно не ощущается как бедствие. Люди не понимали бы, что эти буквы обозначают бедствие, если бы они не понимали суть самого соглашения. Подобным образом, кодон аланина, ГЦЦ, не выглядит, не пахнет и не ощущается как аланин. Кодон не имел бы никакого отношения к аланину, если бы между двумя кодирующими системами (кодом белка и кодом ДНК) не было заранее установленного соглашения о том, что «ГЦЦ должен означать аланин». Для передачи этого соглашения используется семейство преобразователей, аминоацил-тРНК-синтетаз, которые переводят один код в другой.

Это должно было укрепить теорию замысла в 1950-х годах и многие креационисты эффективно её проповедовали. Но эволюционисты похожи на красноречивых торговцев. Они сочинили свои сказки о фее Динь-Динь, которая разбирает код и создает новые виды путем мутации и отбора, и убедили многих людей в том, что чудеса могут происходить и сегодня. Ну, хорошо, сегодня за окном 21-й век и нам известен эпигенетический код и код сплайсинга – два кода, которые намного сложнее и динамичнее, чем простой код ДНК. Мы знаем о кодах внутри кодов, о кодах над кодами и под кодами – нам известна целая иерархия кодов. На этот раз эволюционисты не могут просто вставить палец в пистолет и с блефом убеждать нас своими красивыми речами, когда по обеим сторонам расставлены пушки – целый арсенал, направленный на их главные элементы конструкции. Всё это игра. Вокруг них выросла целая эра информатики, они давно вышли из моды и похожи на Греков, которые пытаются с копьями лезть на современные танки и вертолеты.

Грустно признавать, но эволюционисты не понимают этого, или даже если и понимают, то не собираются сдаваться. Между прочим, на этой неделе, как раз когда была опубликована статья о Коде сплайсинга, со страниц продарвиновских журналов и газет посыпалась наиболее злая и ненавистная за последнее время риторика, направленная против креационизма и разумного замысда. Нам предстоит услышать еще о многих подобных примерах. И пока они держат в своих руках микрофоны и контролируют институты, многие люди будут попадаться на их удочку, думая, что наука продолжает давать им достаточное основание. Мы рассказываем вам всё это для того, чтобы вы читали этот материал, изучали его, понимали и запаслись информацией, которая вам необходима для того, чтобы сразить истиной этот фанатичный, вводящий в заблуждение вздор. А теперь, вперёд!

Генетический код разных организмов обладает некоторыми общими свойствами:
1) Триплетность. Для записи любой, в том числе и наследственной информации используется определенный шифр, элементом которого является буква, или символ. Совокупность таких символов составляет алфавит. Отдельные сообщения записываются комбинацией символов, которые называются кодовыми группами, или кодонами. Известен алфавит, состоящий всего из двух символов, - это азбука Морзе. В ДНК 4 буквы – первые буквы названий азотистых оснований (А, Г, Т, Ц), значит, генетический алфавит состоит всего из 4 символов. Что же является кодовой группой, или, словом генетического кода? Известно 20 основных аминокислот, содержание которых должно быть записано генетическим кодом, т. е. 4 буквы должны дать 20 кодовых слов. Допустим, слово состоит из одного символа, тогда мы получим только 4 кодовые группы. Если же слово состоит из двух символов, то таких групп будет только 16, а этого явно мало, чтобы закодировать 20 аминокислот. Следовательно, в кодовом слове должно быть минимум 3 нуклеотида, что даст 64 (43) сочетания. Такого количества триплетных сочетаний вполне достаточно для кодирования всех аминокислот. Таким образом, кодон генетического кода – это триплет нуклеотидов.
2) Вырожденность (избыточность) – свойство генетического кода состоящее с одной стороны, в том, что он содержит избыточные триплеты, т. е. синонимы, а с другой – «бессмысленные» триплеты. Поскольку код включает 64 сочетания, а кодируются только 20 аминокислот, то некоторые аминокислоты кодируются несколькими триплетами (аргинин, серин, лейцин – шестью; валин, пролин, аланин, глицин, треонин – четырьмя; изолейцин – тремя; фенилаланин, тирозин, гистидин, лизин, аспарагин, глутамин, цистеин, аспарагиновая и глутаминовая кислоты – двумя; метионин и триптофан – одним триплетом). Некоторые кодовые группы (УАА, УАГ, УГА) вообще не несут смысловой нагрузки, т. е. являются «бессмысленными» триплетами. «Бессмысленные», или nonsense, кодоны выполняют функцию терминаторов цепей – знаков препинания в генетическом тексте – служат сигналом окончания синтеза белковой цепи. Такая избыточность кода имеет большое значение для повышения надежности передачи генетической информации.
3) Неперекрываемость. Кодовые триплеты никогда не перекрываются, т. е. всегда транслируются вместе. При считывании информации с молекулы ДНК невозможно использование азотистого основания одного триплета в комбинации с основаниями другого триплета.
4) Однозначность. Нет случаев, когда один и тот же триплет соответствовал бы более чем одной кислоте.
5) Отсутствие разделительных знаков внутри гена. Генетический код считывается с определенного места без запятых.
6) Универсальность. У различных видов живых организмов (вирусов, бактерий, растений, грибов и животных) одинаковые триплеты кодируют одни и те же аминокислоты.
7) Видовая специфичность. Количество и последовательность азотистых оснований в цепи ДНК у разных организмов различные.