Геном человека — одна из главных биологических структур, находящаяся в фокусе внимания науки (в том числе и «Науки в фокусе»). Фактически это всего лишь молекула, пусть и огромная. Однако в ней потенциально заключено столько важных данных, а извлечь их настолько непросто, что изучением этой молекулы будет заниматься еще не одно поколение ученых. Открытие каждого нового пласта информации в геноме требует серьезных усилий и прорывных технологий. И каждая стадия его исследования неизбежно занимает годы.

Первая такая стадия завершилась в начале прошлого десятилетия, когда в рамках международного проекта Human Genome Project впервые была получена полная последовательность нуклеотидов, составляющих человеческую ДНК. Геном был прочитан, и оказалось, что лишь ничтожные его проценты заняты генами, то есть последовательностями, кодирующими белковые продукты. Тут же встала задача разобраться, для чего нужны остальные девяносто с лишним процентов. Увы, знания последовательности для этого недостаточно — нужно проводить эксперименты. Специалистам давно очевидно, что геном должен содержать регуляторные области, управляющие активностью генов. Такие элементы генома предопределяют, при каких условиях и в каком количестве будет производиться тот или иной белок. Чтобы эти участки обнаружить и составить хотя бы предварительную карту генетической регуляции, потребовался новый масштабный проект и почти девять лет исследований.

Наконец в сентябре этого года международный консорциум ENCODE (в него входит 32 лаборатории из нескольких стран) опубликовал данные о функциональных элементах генома человека. Ученые выявили и проанализировали те области, которые взаимодействуют с белками, либо влияют на упаковку молекулы в хроматине, либо служат матрицей для РНК. Суммарная величина таких участков составила 80% ДНК.

Итоги тысяч экспериментов, сведенные в единую базу, еще предстоит осмыслить, чтобы использовать в практических целях. Но уже сейчас ясно, что регулирующая часть генома значительно превышает кодирующую. Согласно ENCODE, только сайты связывания факторов транскрипции занимают минимум 8% генома — это неожиданно много. Любопытно, что эти две части, по всей видимости, по-разному эволюционируют. В целом гены стабильнее, нежели регуляторные элементы, которые варьируют от вида к виду в гораздо большей степени.

Проект ENCODE показал, что картина генетических взаимодействий куда более сложна и запутанна. Геном представлялся раньше как отдельные островки-оазисы, раскиданные по безжизненной пустыне. Теперь его можно представить в виде хитросплетенной сети или, если придерживаться географических образов, непролазных джунглей. Четыре пятых генома биохимически активно, а влияние его частей друг на друга весьма разнообразно.

Основным итогом работы проекта, вероятно, станет смена приоритетов: генетики переключат свое внимание с генов на регуляторные элементы. Многое указывает на то, что именно в регуляции содержится ключ ко многим индивидуальным особенностям человека.

В первую очередь результаты исследования механизмов регуляции генов важны для медицины. Так, в рамках работы ENCODE было установлено, что большинство однонуклеотидных полиморфизмов (различий между людьми в одну букву генома), связанных с той или иной болезнью, находится не в генах, а внутри функциональных элементов либо поблизости от них.

Впрочем, ключевой вопрос о роли всех аннотированных участков генома пока остается без ответа. Члены консорциума ENCODE уже получили свою долю критики за то, что назвали все найденные элементы «функциональными». Биохимически активные 80% генома могут содержать (и наверняка содержат) последовательности, не оказывающие влияния на организм. В таком случае их по-прежнему следует рассматривать в качестве «эволюционного мусора». Однако, как показывают данные ENCODE, разные типы клеток содержат отличающиеся наборы некодирующих РНК. Это может указывать на наличие некоей связанной с ними биологической функции. Кроме того, в экспериментах было задействовано лишь 147 типов клеток и небольшое число факторов транскрипции. Расширение этого списка почти наверняка поднимет нижнюю границу оценки достоверно функциональной ДНК. Члены консорциума полагают, что она близка к 20%. Насколько они правы, покажет время.