Транспозоны

Текст написан с помощь Gemeni 2.5 Pro.

Предисловие

Представление о геноме как о статичном тексте было кардинально пересмотрено после открытия Барбарой МакКлинток "прыгающих генов". Эти исследования показали, что ДНК содержит мобильные элементы, способные перемещаться и изменять геном, раскрыв его неожиданную динамическую природу.

Мобильные генетические элементы, или транспозоны, являются универсальными компонентами геномов, составляя значительную часть ДНК многих видов (около половины у человека). Это привело к формированию концепции "эгоистичной ДНК", рассматривающей транспозоны как элементы, сфокусированные на собственном распространении, что несет риски мутаций и нестабильности для генома хозяина.

Однако роль транспозонов двойственна. С одной стороны, их активность связана с мутагенезом и развитием заболеваний. С другой – они являются важным фактором эволюции, служат источником генетического разнообразия, влияют на архитектуру геномов и регуляцию генов. Примечателен процесс экзаптации ("одомашнивания"), посредством которого последовательности транспозонов были приспособлены для выполнения ключевых клеточных функций, таких как адаптивный иммунитет или поддержание теломер.

В этой книге последовательно освещаются основные аспекты биологии транспозонов: история изучения, классификация и молекулярные механизмы; их влияние на структуру и функцию генома; системы клеточного контроля и коэволюция с хозяином; эволюционное значение с примерами экзаптации; связь с заболеваниями человека; использование в качестве инструментов в исследованиях и биотехнологии.

Издание адресовано студентам, научным сотрудникам в области биологии и медицины, а также всем интересующимся современной генетикой и эволюцией. Книга призвана дать комплексное представление о текущем состоянии знаний в этой динамично развивающейся области.

Изучение мобильных элементов позволяет понять геном не как фиксированный набор инструкций, а как сложную, постоянно эволюционирующую систему. Понимание роли транспозонов в ней является ключом ко многим фундаментальным вопросам современной биологии.

Содержание

Глава 1: Введение: что такое транспозоны?

1.1. Открытие "прыгающих генов": кукуруза Барбары МакКлинток и Нобелевская премия
1.2. Определение транспозона: мобильные генетические элементы
1.3. Распространенность в природе: от бактерий до человека
1.4. Транспозоны в геноме человека: скрытое большинство (LINE-1, Alu)
1.5. Первое знакомство с концепцией "эгоистичной ДНК"
1.6. Краткий обзор влияния транспозонов: мутации, эволюция, регуляция

Глава 2: Классификация транспозонов: основные типы и их структура

2.1. Два класса мобильных элементов: РНК- и ДНК-пути перемещения
2.2. Класс I: Ретротранспозоны – жизнь через РНК-копию

2.2.1. LTR-ретротранспозоны: структура, гены gag, pol, (env), связь с эндогенными ретровирусами
2.2.2. Не-LTR ретротранспозоны: LINEs – длинные автономные элементы
2.2.3. Не-LTR ретротранспозоны: SINEs – короткие неавтономные "пассажиры" LINEs

2.3. Класс II: ДНК-транспозоны – прямая мобилизация ДНК

2.3.1. Структура: ген транспозазы и концевые инвертированные повторы (TIRs)
2.3.2. Основные суперсемейства и разнообразие ДНК-транспозонов
2.3.3. Helitrons и Polintons/Mavericks: альтернативные ДНК-элементы

2.4. Автономность и неавтономность: общая концепция и примеры (MITEs)
2.5. Транспозоны прокариот: инсерционные последовательности (IS) и композитные транспозоны

Глава 3: Механизмы транспозиции: как "прыгают" гены

3.1. Ретротранспозиция ("копировать-вставить")

3.1.1. Роль обратной транскриптазы и эндонуклеазы
3.1.2. Таргет-праймированная обратная транскрипция (TPRT): механизм LINEs и SINEs
3.1.3. Цикл LTR-ретротранспозонов: от РНК к интеграции провирусной ДНК

3.2. ДНК-транспозиция ("вырезать-вставить" и другие)

3.2.1. Фермент транспозаза: узнавание, вырезание, встраивание
3.2.2. Консервативный механизм "вырезать-вставить"
3.2.3. Репликативные механизмы ДНК-транспозонов (включая "катящееся кольцо" Helitrons)

3.3. Следы интеграции: дупликация сайта-мишени (TSDs)
3.4. Выбор места вставки: от случайности до "безопасных гаваней"

Глава 4: Транспозоны и архитектура генома: мутации, перестройки и размер

4.1. Транспозоны как мутагены

4.1.1. Инсерционный мутагенез: нокауты генов и изменение регуляции
4.1.2. Влияние на сплайсинг: потеря и создание экзонов

4.2. Индуцированные транспозонами хромосомные перестройки

4.2.1. Делеции и дупликации через рекомбинацию между копиями
4.2.2. Инверсии и транслокации

4.3. Модуляция экспрессии генов хозяина

4.3.1. Предоставление промоторов, энхансеров, сайтов полиаденилирования
4.3.2. Влияние на структуру хроматина

4.4. Роль транспозонов в определении размера генома и парадокс C-value

Глава 5: Контроль и регуляция: как геном защищается от транспозонов

5.1. Геном под угрозой: почему необходим контроль транспозонов
5.2. Эпигенетический сайленсинг: молчание через модификации

5.2.1. Метилирование ДНК транспозонов
5.2.2. Репрессивные метки гистонов и формирование гетерохроматина

5.3. РНК-интерференция: молекулярные "ножницы" на страже генома

5.3.1. piРНК-путь: защита зародышевой линии, механизм "пинг-понг"
5.3.2. Роль siРНК в соматических клетках

5.4. Белковые факторы рестрикции: прямая оборона (APOBEC и другие)
5.5. Прорыв защиты: стресс-индуцированная активация транспозонов
5.6. Коэволюционная "гонка вооружений" транспозонов и генома хозяина

Глава 6: Эволюционная роль транспозонов: двигатели изменений генома

6.1. Сырье для эволюции: транспозоны как источник генетического разнообразия
6.2. Молекулярное "одомашнивание" (экзаптация): от паразита к симбионту

6.2.1. Происхождение V(D)J-рекомбинации: рождение адаптивного иммунитета (RAG1/2)
6.2.2. Теломераза: решение проблемы концевой репликации
6.2.3. Синцитины: вирусные белки на службе плаценты
6.2.4. Другие примеры: гены, некодирующие РНК, регуляторные элементы

6.3. Транспозоны и эволюция генных регуляторных сетей
6.4. Создание новых генов: перетасовка экзонов (exon shuffling)
6.5. Роль транспозонов в видообразовании
6.6. Горизонтальный перенос генов: транспозоны как переносчики информации между видами
6.7. Динамика популяций транспозонов: активация, распространение, инактивация и удаление

Глава 7: Транспозоны и здоровье: вклад в болезни и старение

7.1. Менделевские болезни человека, вызванные транспозонами (гемофилия, миодистрофия Дюшенна и др.)
7.2. Соматическая активность транспозонов: угроза стабильности генома

7.2.1. Транспозоны и рак: мутации, геномная нестабильность, эпигенетические изменения
7.2.2. Транспозоны, старение и нейродегенеративные заболевания (болезнь Альцгеймера, Паркинсона)

7.3. Транспозоны как триггеры воспаления и аутоиммунитета (распознавание нуклеиновых кислот ТЭ)
7.4. Потенциальные терапевтические стратегии: воздействие на активность транспозонов

Глава 8: Транспозоны как инструменты: от генетики к биотехнологии

8.1. Транспозонный мутагенез для функциональной геномики (вперед и назад)
8.2. Создание трансгенных организмов с помощью транспозонов
8.3. Системы транспозонов (Sleeping Beauty, PiggyBac) в генотерапии
8.4. Другие применения: картирование, филогенетика, индукция перестроек

Глава 9: Заключение: вездесущие и влиятельные элементы генома

9.1. Двойственная природа транспозонов: паразитизм и симбиоз на уровне генома
9.2. Транспозомы: транспозоны как интегральная часть геномной экосистемы
9.3. Неизведанные территории: открытые вопросы и перспективы исследований транспозонов

Глава 1: Введение: что такое транспозоны?

1.1. Открытие "прыгающих генов": кукуруза Барбары МакКлинток и Нобелевская премия

Представьте себе середину XX века. В генетике доминирует представление о генах как о статичных бусинах, нанизанных в строгом порядке на нити хромосом. Считалось, что их положение неизменно, а мутации – это в основном точечные изменения или крупные перестройки фиксированных участков. Однако именно в это время, в 1940-х и 1950-х годах, американский генетик Барбара МакКлинток, работая с обыкновенной кукурузой (Zea mays), сделала открытие, которое опередило свое время и навсегда изменило взгляд на геном [1].

МакКлинток была чрезвычайно наблюдательным и дотошным исследователем. Изучая наследование окраски зерен кукурузы, она столкнулась с необъяснимым явлением: некоторые мутации вели себя крайне нестабильно. Вместо ожидаемой однородной окраски или четкого мозаичного рисунка, зерна демонстрировали пеструю картину – пятна и штрихи разного цвета, которые появлялись и исчезали у потомков непредсказуемым образом. Это было похоже на то, будто некий генетический элемент мог включать и выключать ген окраски, причем делал это в разных клетках развивающегося зерна в разное время.

Более того, МакКлинток заметила, что эта нестабильность связана с определенными участками хромосом, которые, казалось, могли не только влиять на соседние гены, но и перемещаться в новые места генома! Она идентифицировала два таких взаимодействующих элемента, которые назвала "контролирующими элементами": Диссоциатор (Ds) и Активатор (Ac). Ключевое различие, как поняли позже, было в том, что Ac – это автономный элемент: он нес ген фермента (транспозазы), необходимого для перемещения. А Ds был неавтономным – у него этот ген был сломан, но сохранились сигнальные последовательности на концах, которые транспозаза могла распознать. Поэтому Ds мог вызывать разрывы хромосом и изменять работу соседних генов, но только в присутствии Ac, как бы "одалживая" у него необходимый фермент [2]. Сам же Ac мог перемещаться по геному самостоятельно.

Но почему эти элементы вообще перемещались? Что их заставляло "прыгать"? Как мы узнаем дальше в этой книге, такие элементы часто сами кодируют специальные белки-ферменты (как транспозаза у Ac), которые распознают концы элемента и катализируют его вырезание и встраивание в новое место. То есть их мобильность – это не результат случайного внешнего воздействия, а скорее выполнение программы, заложенной в их собственной последовательности ДНК.

Как именно перемещение элемента Ds вызывало изменение цвета зерен и приводило к появлению пятен? Представьте, что элемент Ds встроился в ген, отвечающий за синтез фиолетового пигмента, и 'сломал' его – ген перестал работать. Клетка и все ее потомки не могли производить пигмент, формируя бесцветный (желтый) фон зерна. Но если в ходе развития зерна в какой-то отдельной клетке элемент Ds (под действием фермента от Ac) 'выпрыгивал' из гена, то работа гена восстанавливалась! Все клетки-потомки этой "исправленной" клетки уже синтезировали пигмент, образуя фиолетовое пятно или штрих на бесцветном фоне. Чем раньше в развитии происходило такое "выпрыгивание", тем больше успевало нарасти пятно. Разное время и место таких событий в разных клетках и создавало уникальную пеструю окраску каждого зерна.

В то время идея о подвижных генах была революционной и шла вразрез с устоявшейся догмой о стабильности генома. Научное сообщество встретило гипотезу МакКлинток с большим скептицизмом [3]. Ее результаты были сложны для интерпретации без современных молекулярных методов, а сама идея о мобильных генах казалась слишком радикальной.

Однако время расставило все по своим местам. В 1960-х и 1970-х годах, с развитием молекулярной биологии, были открыты мобильные генетические элементы у бактерий (инсерционные последовательности и транспозоны), а затем и у других организмов. Последующие исследования показали, что мобильные элементы – не экзотика кукурузы или бактерий, а фундаментальная и вездесущая часть геномов подавляющего большинства живых существ, от архей и бактерий до растений и животных, включая человека. Их точное происхождение остается предметом активных исследований, но несомненно, что они являются древними компонентами жизни, возможно, связанными общим происхождением с вирусами или возникшими независимо как форма "генетического паразитизма". Молекулярные данные полностью подтвердили выводы, сделанные Барбарой МакКлинток десятилетиями ранее на основе генетического анализа кукурузы. Ее "контролирующие элементы" Ac и Ds оказались первыми открытыми транспозонами – участками ДНК, способными к перемещению.

За свое новаторское открытие, которое фундаментально изменило наши представления о динамичности генома, Барбара МакКлинток в 1983 году была удостоена Нобелевской премии по физиологии или медицине. Ее работа заложила основу для понимания транспозонов – удивительных и вездесущих компонентов геномов, о которых и пойдет речь в этой книге.

1.2. Определение транспозона: мобильные генетические элементы

Итак, работа Барбары МакКлинток показала, что геном – это не застывшая структура, а динамичная система, внутри которой существуют особые участки ДНК, способные менять свое положение. Что же представляют собой эти "прыгающие гены" с молекулярной точки зрения?

Сегодня для их обозначения используются термины транспозон или, более общее, мобильный генетический элемент (МГЭ). Термин "мобильный генетический элемент" (МГЭ) является наиболее общим. "Транспозон" часто используется как синоним, хотя иногда его применяют более узко – например, только к эукариотическим МГЭ или конкретно к элементам, перемещающимся через ДНК (Класс II). В этой книге мы будем использовать эти термины преимущественно взаимозаменяемо, уточняя при необходимости. По определению, это дискретные последовательности ДНК, которые обладают способностью перемещаться из одного участка генома (донорного сайта) в другой (сайт-мишень или акцепторный сайт) в пределах одной клетки. Сам процесс этого перемещения называется транспозицией [4]. Причем перемещение может происходить как в пределах одной хромосомы, так и между разными хромосомами. А вот "выпрыгнуть" из генома совсем, не встроившись в другое место ДНК, в ходе типичной транспозиции элемент не может – механизм предусматривает интеграцию в новую позицию. Потеря элемента из генома может произойти другими путями, например, при случайной делеции участка хромосомы.

Важно понимать, что транспозоны – это именно участки ДНК, являющиеся частью генома организма (его хромосом или плазмид). Этим они отличаются, например, от вирусов, которые являются автономными инфекционными частицами, перемещающимися между клетками или организмами (хотя, как мы увидим позже, между вирусами и некоторыми типами транспозонов существует глубокая эволюционная связь). Транспозоны же "живут" и перемещаются внутри генетического материала клетки-хозяина.

Способность к транспозиции заложена в самой структуре мобильного элемента. Как правило, он содержит не только последовательности ДНК, необходимые для узнавания ферментами, отвечающими за перемещение, но часто и ген (или гены), кодирующий сам этот фермент (или ферменты). Такие элементы называют автономными. Однако, как и в случае с парой Ac/Ds из предыдущего раздела, существуют и неавтономные элементы, которые утратили способность кодировать свои ферменты, но сохранили сигналы для перемещения. Они могут "прыгать", только если в клетке есть активный автономный "родственник", предоставляющий нужные белки.

Возникает закономерный вопрос: зачем клетке такие "прыгающие" элементы, способные вызывать мутации? Не вредны ли они? Это один из центральных вопросов в изучении транспозонов. С одной стороны, их часто рассматривают как "генетических паразитов" или "эгоистичную ДНК", главная "цель" которых – собственное размножение в геноме хозяина, порой во вред последнему [5]. С другой стороны, нельзя отрицать их огромную роль в эволюции. Создавая изменчивость, перестраивая геномы и даже предоставляя материал для новых генов и регуляторных путей (как мы увидим в главе 6), они могут способствовать адаптации и развитию новых признаков у хозяина. Их повсеместное распространение и сохранение в геномах на протяжении миллиардов лет говорит о сложном балансе между их "эгоизмом" и потенциальной пользой для эволюции генома.

Хотя все транспозоны объединяет способность к перемещению, делают они это по-разному. Существуют два фундаментально различных пути транспозиции, которые легли в основу деления всех мобильных элементов на два больших класса [6]. Один класс перемещается через промежуточную РНК-копию, используя процесс, похожий на тот, что используют ретровирусы. Этот механизм обычно работает по принципу "копировать-вставить" (copy-and-paste), то есть исходный элемент остается на месте, а его копия встраивается в новое место, увеличивая общее число копий в геноме. Другой класс перемещается непосредственно в виде ДНК, чаще всего используя механизм "вырезать-вставить" (cut-and-paste), при котором элемент покидает старое место и перемещается на новое, сохраняя общее число копий неизменным (хотя и здесь есть варианты). Подробнее об этих механизмах и классификации мы поговорим в следующих главах.

Открытие транспозонов и осознание их способности к перемещению произвело революцию в биологии. Стало ясно, что геном – это не просто статичный набор инструкций, а живая, изменяющаяся структура, где мобильные элементы играют важную роль, постоянно перекраивая генетический ландшафт. Они вносят вклад в мутации, влияют на работу генов, изменяют размер генома и служат важным фактором эволюции. Понимание того, что такое транспозоны и как они работают, является ключом к пониманию многих аспектов функционирования и эволюции живых систем.

1.3. Распространенность в природе: от бактерий до человека

После того как мобильные генетические элементы были открыты у кукурузы и бактерий, ученые начали находить их повсюду. Оказалось, что транспозоны – это не редкое или экзотическое явление, а абсолютно универсальный компонент жизни на Земле. Они обнаружены в геномах представителей всех трех доменов жизни: Бактерий, Архей и Эукариот, к которым относятся грибы, растения и животные, включая человека [7].

Однако количество транспозонов в разных геномах может кардинально отличаться. Их доля в общем объеме ДНК варьирует от долей процента до совершенно ошеломляющих величин.

У прокариот (бактерий и архей) транспозоны обычно составляют относительно небольшую долю генома, часто менее 1-2%. Тем не менее, они играют критически важную роль в их эволюции и адаптации. Простейшие из них, инсерционные последовательности (IS-элементы), способствуют геномным перестройкам, а более сложные композитные транспозоны часто несут гены, придающие полезные свойства, например, устойчивость к антибиотикам, и могут быстро распространять эти гены между разными бактериями через горизонтальный перенос [8]. Как они это делают? Часто это происходит благодаря композитным транспозонам. Такой транспозон состоит из центрального участка ДНК (например, с геном устойчивости к антибиотику), фланкированного двумя копиями IS-элемента. IS-элементы предоставляют фермент (транспозазу) и сигналы для перемещения, в результате чего весь блок – IS-элементы вместе с "захваченным" геном – может "перепрыгнуть" на плазмиду (небольшую кольцевую ДНК). Плазмиды же легко передаются другим бактериям, быстро распространяя ген устойчивости в популяции.

У эукариот картина гораздо более пестрая. Некоторые одноклеточные эукариоты, такие как пекарские дрожжи (Saccharomyces cerevisiae), содержат довольно мало транспозонов – около 3-4% генома [10]. У многоклеточных животных их доля обычно выше. Например, у плодовой мушки Drosophila melanogaster, классического объекта генетики, мобильные элементы занимают примерно 15-20% генома [11]. В геномах млекопитающих, включая человека, транспозоны составляют огромную долю. Как мы уже упоминали, около 45-50% человеческого генома представлено последовательностями транспозонного происхождения [9]. Подавляющее большинство из них относится к классу ретротранспозонов, в основном это элементы семейств LINE-1 и Alu. Большинство этих копий уже неактивны из-за накопленных мутаций или подавлены клеточными защитными механизмами. Но значит ли это, что они бесполезны? Не совсем. Хотя многие из них можно считать "молекулярными ископаемыми" или генетическими реликтами, они вносят вклад в общую архитектуру генома. Кроме того, даже неактивные последовательности могут содержать регуляторные элементы (например, сайты связывания белков), которые клетка может "одомашнить" для своих нужд. Также они могут служить точками для рекомбинации, иногда приводя к полезным (или вредным) перестройкам.

Но настоящими чемпионами по содержанию транспозонов являются растения. У многих видов с крупными геномами мобильные элементы могут составлять подавляющую часть ДНК. Например, у кукурузы (Zea mays), на которой работала Барбара МакКлинток, транспозоны занимают около 85% всего генома [12]! У пшеницы эта цифра также достигает примерно 80%.

Почему же наблюдается такая огромная разница – от скромных 3% у дрожжей до 85% у кукурузы? Оказывается, количество транспозонов (и связанный с этим общий размер генома) не имеет прямой связи со сложностью строения организма. Это явление называют "парадоксом C-value" [13], и оно показывает, что не только число генов определяет сложность. Баланс транспозонов в геноме зависит от многих факторов: от активности самих элементов (например, элементы Класса I, работающие по принципу "копировать-вставить", особенно склонны к накоплению), от эффективности механизмов контроля и удаления ДНК у хозяина. В разных эволюционных линиях этот баланс устанавливается по-своему, приводя к такому разнообразию геномных ландшафтов. Важно также отметить, что высокая доля транспозонов в геноме, как у кукурузы, не всегда означает высокую текущую активность всех этих копий – многие могут быть неактивны. И наоборот, низкая доля, как у бактерий, не исключает высокой активности и значимости имеющихся элементов. В геноме человека большинство транспозонных последовательностей – это действительно древние, давно замолчавшие копии.

Таким образом, транспозоны – это не исключение, а правило. Они являются неотъемлемыми и зачастую доминирующими компонентами геномов во всех царствах живой природы. Их повсеместное распространение свидетельствует об их древнем происхождении и огромном влиянии на эволюцию жизни на нашей планете.

1.4. Транспозоны в геноме человека: скрытое большинство (LINE-1, Alu)

Давайте теперь подробнее рассмотрим ситуацию с мобильными элементами в нашем собственном геноме. Как уже упоминалось, последовательности транспозонного происхождения составляют почти половину (около 45-50%) всей человеческой ДНК [9]. Это огромное количество, значительно превышающее долю генов, кодирующих белки (которая составляет всего около 1.5-2%). По сути, большая часть нашего генома – это своего рода палеонтологическая летопись активности мобильных элементов в эволюции приматов и млекопитающих.

Кто же является основными "жителями" этого скрытого мира внутри нашей ДНК? Подавляющее доминирование принадлежит ретротранспозонам (Класс I), а среди них выделяются два главных семейства: LINE-1 и Alu.

LINE-1 (Long Interspersed Nuclear Element 1, или L1) – это длинные (около 6000 пар оснований) автономные не-LTR ретротранспозоны. Они автономны, потому что кодируют два белка, необходимых для их собственного копирования и встраивания в геном: обратную транскриптазу и эндонуклеазу. В нашем геноме насчитывается более полумиллиона копий LINE-1. Подавляющее большинство из них укорочены, повреждены мутациями и неспособны к перемещению. Однако примерно 80-100 копий LINE-1 в геноме среднего человека все еще остаются потенциально активными [14]. Хотя это число кажется небольшим по сравнению с общим количеством копий, его не стоит недооценивать. Даже одна активная копия LINE-1 может действовать как "мастер-элемент", производя множество новых вставок на протяжении жизни организма или в ходе эволюции поколений. Каждая новая вставка – это потенциальная мутация. Кроме того, белки, производимые активными LINE-1, мобилизуют и сотни тысяч неавтономных элементов (Alu, SVA), многократно усиливая общее мутагенное давление на геном.

Alu-элементы – это короткие (около 300 пар оснований) неавтономные ретротранспозоны, относящиеся к классу SINEs (Short Interspersed Nuclear Elements). Они не кодируют собственных белков для перемещения и полностью зависят от ферментов, производимых активными элементами LINE-1. Считается, что Alu произошли от гена клеточной РНК под названием 7SL РНК через процесс, называемый ретропозицией. Если получившаяся ДНК-копия сохранила способность узнаваться ферментами LINE-1 и транскрибироваться, она смогла начать распространяться по геному, положив начало семейству Alu. Эти элементы оказались невероятно успешны: в нашем геноме содержится более миллиона копий Alu, что делает их самыми многочисленными мобильными элементами. Такой ошеломляющий успех Alu, вероятно, объясняется сочетанием факторов: их последовательности эффективно распознаются и копируются ферментами LINE-1, возможно, они менее вредны для клетки, что позволяет накапливать больше копий, и/или они лучше уклонялись от систем клеточного контроля на ранних этапах эволюции приматов. Интересно, что Alu-элементы являются уникальной чертой геномов приматов, что указывает на их возникновение уже после отделения предков приматов от других млекопитающих [15].

Разница в занимаемом проценте генома при разном числе копий Alu (~11% генома, >1 млн копий) и LINE-1 (~17% генома, ~0.5 млн копий) объясняется размерами элементов: каждый LINE-1 очень длинный (~6000 пар оснований), тогда как Alu совсем короткие (~300 пар оснований). Поэтому, несмотря на меньшее число копий, общая длина всех LINE-1 в геноме превышает общую длину всех Alu.

Помимо LINE-1 и Alu, в геноме человека присутствуют и другие типы мобильных элементов, но в значительно меньших количествах. К ним относятся:

SVA-элементы: еще один тип неавтономных ретротранспозонов, использующих машину LINE-1; они имеют сложную структуру (SINE-VNTR-Alu).
LTR-ретротранспозоны: в основном представлены остатками древних эндогенных ретровирусов (ERV), интегрировавшихся в геном наших предков. Большинство из них давно неактивны.
ДНК-транспозоны (Класс II): в геноме человека они представлены исключительно неактивными, "мертвыми" копиями. Причины их "вымирания" в геноме человека до конца не ясны. Возможно, активные семейства ДНК-транспозонов просто накопили слишком много мутаций и потеряли активность в линии млекопитающих, и не произошло "заражения" новыми активными элементами. Либо системы защиты генома у млекопитающих стали особенно эффективно подавлять именно этот класс транспозонов. Вероятно, истина лежит в комбинации этих факторов.

Таким образом, геном человека представляет собой сложный ландшафт, сформированный волнами активности различных мобильных элементов на протяжении эволюции. Хотя большинство из них сегодня молчит, остаточная активность LINE-1 продолжает вносить свой вклад в изменчивость и иногда приводит к возникновению генетических заболеваний.

1.5. Первое знакомство с концепцией "эгоистичной ДНК"

Мы увидели, что транспозоны широко распространены и составляют огромную часть геномов многих организмов, включая человека. Часто они не несут очевидной пользы для своего хозяина, а их перемещения могут быть вредны, вызывая мутации. Это неизбежно привело ученых к вопросу: почему эти элементы так успешны и почему они сохраняются в геномах на протяжении миллионов лет эволюции? Важно отметить, что концепция, которую мы сейчас обсудим, в первую очередь объясняет, почему транспозоны сохраняются и накапливаются в геномах, а не их изначальное происхождение. Вопрос о том, как появились первые мобильные элементы (возможно, из вирусов или других генетических структур), остается отдельной сложной темой для обсуждения.

В 1980 году две группы ученых – Форд Дулиттл и Кармен Сапиенца, а также Лесли Оргел и Фрэнсис Крик – независимо друг от друга предложили провокационную и влиятельную идею, известную как концепция "эгоистичной ДНК" (selfish DNA) [16, 17].

Основная идея этой концепции заключается в том, что мобильные генетические элементы существуют и распространяются в геноме не потому, что они приносят пользу организму-хозяину, а потому, что они обладают способностью к самокопированию и перемещению. С этой точки зрения, транспозоны можно рассматривать как своего рода молекулярных "паразитов" или, возможно, симбионтов на уровне генома [5]. Их "главная цель" – не выполнение какой-либо функции для клетки, а обеспечение собственного "выживания" и размножения внутри геномной среды.

В отличие от обычных генов, которые подвергаются отбору на уровне организма (т.е. сохраняются, если повышают приспособленность особи), "эгоистичная ДНК" подвергается отбору на уровне самого генома. Успешным оказывается тот элемент, который может эффективнее копировать себя и встраиваться в новые места, не убивая при этом своего хозяина слишком быстро. Они добиваются этого, либо кодируя собственные ферменты для мобильности (как LINE-1), либо используя ферменты других элементов (как Alu) или даже клеточные механизмы. Конечно, клетка-хозяин не является пассивным наблюдателем. У нее есть мощные защитные механизмы (о которых мы подробно поговорим в главе 5), пытающиеся подавить активность транспозонов и ограничить их распространение. Однако эти защитные системы не всегда абсолютно эффективны, а сами транспозоны могут эволюционировать, чтобы обходить их. Поэтому полное уничтожение "геномных паразитов" часто невозможно или слишком "дорого" для клетки.

Концепция "эгоистичной ДНК" помогла объяснить многие загадки геномики, в частности, "парадокс C-value" – почему количество ДНК у разных видов так сильно варьирует и часто не коррелирует с их сложностью [13]. Значительная часть этой "избыточной" ДНК как раз и может представлять собой накопленные копии различных семейств "эгоистичных" мобильных элементов.

Важно понимать, что термин "эгоистичная" не несет моральной оценки. Он лишь описывает механизм отбора, действующий на эти последовательности: их успех определяется способностью к саморепликации внутри генома. Кроме того, эта концепция не исключает того, что "эгоистичные" по своей природе элементы могут иметь разнообразные (иногда вредные, иногда нейтральные, а иногда и полезные) последствия для хозяина. Как мы увидим далее, взаимодействие между транспозонами и геномом хозяина – это сложный процесс коэволюции. Можно представить это как непрерывную "гонку вооружений" или динамическое равновесие. Нет явного "победителя": иногда верх берут транспозоны, активно размножаясь, иногда – защитные системы хозяина, подавляя их активность. Результатом часто является некий баланс, при котором транспозоны сохраняются, но их активность в основном контролируется. В ходе этой коэволюции некоторые элементы могут быть "одомашнены" (экзаптированы) и начать выполнять полезные функции. Меняет ли это их "эгоистичную" природу? С точки зрения концепции, их изначальная "цель" остается саморепликацией. Однако, если их присутствие или активность случайно становится полезной, отбор на уровне хозяина может начать поддерживать их сохранение уже из-за этой новой функции. Сам элемент не "решает" стать полезным, но его "эгоизм" может быть поставлен на службу хозяину.

При этом не все транспозоны одинаково "агрессивны" в своем "эгоизме". Разные семейства отличаются по своей активности, способам перемещения и влиянию на геном. Некоторые активно размножаются и часто вызывают мутации, в то время как другие могут перемещаться редко или встраиваться в относительно безопасные участки генома, больше напоминая не "паразитов", а "попутчиков".

Тем не менее, концепция "эгоистичной ДНК" остается мощным инструментом для понимания движущих сил эволюции мобильных элементов и их поведения в геноме. Она напоминает нам, что геном – это не только гармонично работающая машина, но и арена для конкуренции и взаимодействия различных генетических сущностей.

1.6. Краткий обзор влияния транспозонов: мутации, эволюция, регуляция

Итак, мы познакомились с транспозонами – мобильными генетическими элементами, широко распространенными в природе, составляющими значительную часть многих геномов и часто действующими по принципу "эгоистичной ДНК". Но каково их реальное влияние на жизнь клетки и организма в целом? Последствия их активности чрезвычайно разнообразны и затрагивают практически все аспекты биологии генома. В последующих главах мы подробно рассмотрим эти эффекты, а пока лишь кратко очертим основные направления их влияния.

Во-первых, транспозоны являются мощными мутагенами. Встраиваясь в кодирующую часть гена или его регуляторную область, они могут нарушить его функцию или изменить характер экспрессии. Кроме того, рекомбинация между различными копиями транспозонов может приводить к крупномасштабным перестройкам генома: делециям (удалению участков ДНК), дупликациям (удвоению), инверсиям (повороту участков) и даже транслокациям (переносу фрагментов между хромосомами) [18]. Это происходит потому, что разбросанные по геному похожие последовательности ТЭ могут "запутать" клеточные системы репарации и рекомбинации ДНК, приводя к ошибочному спариванию и соединению участков хромосом (детали механизмов мы рассмотрим в главе 4).

Во-вторых, транспозоны играют важную роль в регуляции экспрессии генов. Их вставки могут привносить новые регуляторные элементы (промоторы, энхансеры, сайленсеры) или изменять существующие, влияя на то, когда, где и в каком количестве будет синтезироваться белок с соседнего гена [19]. Обычно это происходит не целенаправленно по отношению к конкретному гену, а скорее как случайное следствие того, куда именно встроился элемент и какие регуляторные сигналы он сам несет (подробнее в главе 4). Они также могут служить источником новых некодирующих РНК, участвующих в регуляции.

В-третьих, мобильные элементы – это ключевые игроки в эволюции генома. Они вносят основной вклад в изменение размера генома у многих видов. Важнее то, что они служат неиссякаемым источником генетического разнообразия, поставляя сырье для естественного отбора. Уникальный процесс экзаптации ("одомашнивания") позволяет геному хозяина использовать фрагменты транспозонов или кодируемые ими белки для создания совершенно новых генов и функций, таких как система адаптивного иммунитета у позвоночных или формирование плаценты у млекопитающих [20]. Хотя такие яркие примеры, как создание системы V(D)J-рекомбинации или белков синцитинов для плаценты, могут быть относительно редки, мы увидим (в главе 6), что использование транспозонных последовательностей для формирования новых регуляторных участков генома, по-видимому, является весьма распространенным явлением в эволюции.

В-четвертых, существование активных транспозонов вызывает ответную реакцию со стороны генома хозяина, который разрабатывает сложные системы защиты и контроля (эпигенетическое подавление, РНК-интерференция), что приводит к непрерывной коэволюционной "гонке вооружений" [21]. Несмотря на наличие этих мощных защитных систем, контроль никогда не бывает абсолютным. Это динамическое равновесие, которое может нарушаться (например, при стрессе или появлении новых агрессивных элементов), что и позволяет транспозонам оказывать свое влияние на геном (эту "гонку вооружений" мы обсудим в главе 5).

Наконец, активность транспозонов имеет прямое отношение к здоровью и болезням человека. Их вставки могут быть причиной ряда наследственных заболеваний, а их соматическая активность в клетках тела связана с процессами старения и развитием онкологических заболеваний.

Таким образом, мобильные генетические элементы – это не просто пассивные участки ДНК. Они активно взаимодействуют с геномом хозяина, обладая как разрушительным потенциалом, так и созидательной силой, движущей эволюцию. Оценить однозначно, чего больше – вреда или пользы – от транспозонов для вида в целом, крайне сложно. Это постоянный баланс между сиюминутным риском мутаций для индивида и долгосрочным эволюционным потенциалом для вида, который мы будем исследовать на протяжении книги. В следующих главах мы погрузимся в детальное изучение каждого из этих аспектов, чтобы раскрыть удивительный и сложный мир транспозонов.

Глава 2: Классификация транспозонов: основные типы и их структура

2.1. Основной принцип классификации: РНК- или ДНК-интермедиат

Мир мобильных генетических элементов поражает своим разнообразием. Чтобы ориентироваться в этом многообразии, необходима система классификации. Самый фундаментальный и общепринятый способ разделения транспозонов на группы основан на ключевом различии в их жизненном цикле: какая молекула используется в качестве промежуточного продукта (интермедиата) при перемещении – РНК или ДНК?

Исходя из этого критерия, все мобильные генетические элементы делят на два основных класса [22]:

Класс I: Ретротранспозоны. Эти элементы перемещаются через РНК-интермедиат. Процесс начинается с транскрипции ДНК ретротранспозона в молекулу РНК. Затем эта РНК служит матрицей для синтеза ДНК-копии с помощью специфического фермента – обратной транскриптазы (или ревертазы), которую обычно кодирует сам ретротранспозон (если он автономен). Именно этот этап, обратная транскрипция (синтез ДНК на матрице РНК), является определяющей характеристикой ретроэлементов. Полученная ДНК-копия затем встраивается в новое место генома. Поскольку исходный ДНК-элемент обычно остается на своем месте в хромосоме, а в новое место встраивается дополнительная ДНК-копия, синтезированная с РНК-матрицы, этот механизм часто называют "копировать-вставить" (copy-and-paste). Такой способ перемещения приводит к увеличению числа копий элемента в геноме, что объясняет, почему ретротранспозоны вносят столь значительный вклад в размер геномов многих эукариот.
Класс II: ДНК-транспозоны. Эти элементы перемещаются непосредственно в виде ДНК, без образования РНК-интермедиата и без необходимости в обратной транскрипции. Ключевым ферментом для их мобильности обычно является транспозаза, которую также часто кодирует сам ДНК-транспозон (автономные элементы). Неавтономные элементы обоих классов зависят от ферментов, предоставляемых их активными "родственниками". Транспозаза распознает концы ДНК-транспозона, физически вырезает его из исходного положения (донорного сайта) и катализирует его встраивание в новое место (сайт-мишень). В простейшем и наиболее распространенном случае, элемент покидает старое место, поэтому такой механизм называют "вырезать-вставить" (cut-and-paste), и он не увеличивает общее число копий за один акт транспозиции. Однако, именно поэтому мы используем оговорки "чаще всего" и "обычно", так как существуют и репликативные механизмы ДНК-транспозиции, при которых создается новая копия элемента без удаления старой (детали мы рассмотрим позже). Важно, что и они происходят без РНК-интермедиата.

С эволюционной точки зрения, эти два класса представляют собой разные миры. Ретротранспозоны (Класс I), особенно некоторые их типы, действительно тесно связаны с ретровирусами, и граница между ними порой размыта. ДНК-транспозоны (Класс II), вероятно, имеют иное и, возможно, не однократное происхождение, возможно, от древних систем репликации или репарации ДНК или от плазмидных элементов.

Это фундаментальное различие – использование РНК-интермедиата и обратной транскриптазы у Класса I и прямое перемещение ДНК с участием транспозазы у Класса II – определяет многие другие особенности этих элементов, включая их структуру, детальные механизмы перемещения, регуляцию и эволюционную динамику. Зачем природе понадобились два столь разных способа? Вероятно, каждый из них имеет свои преимущества и недостатки в разных условиях и геномных контекстах, что и привело к их параллельному существованию и успеху. Данная классификация на два класса служит основой для дальнейшего, более детального деления транспозонов на порядки, суперсемейства и семейства, которое мы рассмотрим далее.

2.2.1. LTR-ретротранспозоны: структура и связь с ретровирусами

Первая крупная группа ретротранспозонов (Класса I), которую мы рассмотрим, – это LTR-ретротранспозоны. Свое название они получили благодаря наличию характерных структур на концах – длинных концевых повторов или LTR (Long Terminal Repeats). Эти повторы представляют собой идентичные последовательности ДНК длиной от нескольких сотен до нескольких тысяч пар оснований, ориентированные в одном направлении (прямые повторы).

LTR – это не просто пассивные фланкирующие последовательности; они несут важнейшие регуляторные функции. Внутри LTR находятся:

Промотор и энхансер: Участки, с которых начинается транскрипция элемента клеточной РНК-полимеразой II.
Сигнал полиаденилирования: Указывает место окончания транскрипции и добавления поли(А)-хвоста к РНК-транскрипту.
Участки для праймирования обратной транскрипции: Необходимы для инициации синтеза ДНК на РНК-матрице.
Сигналы для интеграции: Участки, распознаваемые ферментом интегразой при встраивании новой ДНК-копии в геном хозяина. Как же одна последовательность LTR может выполнять и роль "старта", и роль "стопа" для РНК? Дело в том, что промоторные элементы активны только в 5'-LTR интегрированной ДНК, инициируя транскрипцию, а сигнал полиаденилирования распознается только в 3'-концевой LTR на РНК-транскрипте, завершая его. Такое контекстно-зависимое действие позволяет LTR управлять и началом, и концом синтеза РНК элемента.

Между двумя LTR располагается внутренняя кодирующая область, которая обычно содержит гены, гомологичные генам ретровирусов. Как правило, это два основных гена:

gag (group-specific antigen): Кодирует структурные белки, которые формируют вирусоподобную частицу (virus-like particle, VLP) внутри клетки. Зачем нужна эта структура? VLP создает изолированное пространство, где концентрируются РНК-матрица, ферменты (RT, IN) и другие компоненты, необходимые для обратной транскрипции. Это защищает нестабильные промежуточные молекулы от клеточных ферментов (нуклеаз) и систем "врожденного иммунитета", обеспечивая эффективность и специфичность процесса. Именно внутри этой частицы происходит обратная транскрипция.
pol (polymerase): Кодирует полипротеин, который затем нарезается протеазой (PR) на несколько ферментов: обратную транскриптазу (RT), РНКазу H и интегразу (IN). Часто ген pol экспрессируется вместе с gag как единый полипротеин Gag-Pol за счет специальных механизмов (например, сдвига рамки считывания). В чем смысл такой стратегии? Это позволяет элементу точно контролировать соотношение производимых белков: для сборки VLP нужно много структурных белков Gag, но гораздо меньше ферментативных белков Pol. Синтез в виде полипротеина с последующим нарезанием – это экономичный и распространенный у вирусов и ретроэлементов способ обеспечить правильную стехиометрию белков [23].

Некоторые LTR-ретротранспозоны содержат еще и третий ген, похожий на ген env (envelope) ретровирусов, который кодирует белки оболочки вируса. Наличие или отсутствие гена env часто служит границей между "типичными" LTR-ретротранспозонами и эндогенными ретровирусами (ERV) [24]. ERV – это, по сути, древние ретровирусы, встроившиеся в геном наших предков. Если ERV в ходе мутаций теряет функциональный ген env, он действительно становится неотличим по своему поведению от "классического" LTR-ретротранспозона, теряя способность формировать инфекционные частицы и перемещаясь только внутри генома. Большинство ERV в геноме человека неактивны. LTR-ретротранспозоны без гена env изначально не могут покидать клетку. Важно отметить, что для своего перемещения LTR-элементы, помимо собственных Gag и Pol белков, часто нуждаются и в некоторых факторах клетки-хозяина (например, тРНК для праймирования обратной транскрипции, клеточные белки для транспорта в ядро).

Именно это сходство с ретровирусами – наличие LTR, генов gag, pol (иногда env), образование VLP и механизм репликации через обратную транскрипцию внутри частицы с последующей интеграцией – является ключевой особенностью LTR-ретротранспозонов [23]. Их классифицируют на несколько крупных суперсемейств, наиболее известные из которых – Ty1/copia и Ty3/gypsy.

2.2.2. Не-LTR ретротранспозоны: LINEs (структура, автономность)

Вторая основная группа ретротранспозонов (Класса I) – это элементы, у которых отсутствуют длинные концевые повторы (LTR). Их называют не-LTR ретротранспозонами. Наиболее известными и распространенными представителями этой группы являются LINEs (Long Interspersed Nuclear Elements – Длинные Диспергированные Ядерные Элементы). Яркий пример – уже знакомые нам элементы LINE-1 (L1), доминирующие в геноме человека.

Структура типичного полноразмерного LINE-элемента отличается от LTR-ретротранспозонов:

5'-нетранслируемая область (5'-UTR): Содержит внутренний промотор, распознаваемый клеточной РНК-полимеразой II, который инициирует транскрипцию элемента. Почему промотор внутренний, а не в LTR? Такая организация гарантирует, что любая транскрибированная РНК-копия, даже если она неполная с 3'-конца, будет содержать промотор, потенциально позволяя новой встройке (если она достаточно полная с 5'-конца) быть снова активной.
Две открытые рамки считывания (ORF – Open Reading Frame):

ORF1: Кодирует РНК-связывающий белок. Какова его точная роль? Он избирательно связывается с РНК-копией LINE, "упаковывая" ее и формируя рибонуклеопротеиновый комплекс (РНП). Это критически важно для стабильности РНК, ее транспорта из цитоплазмы в ядро и, вероятно, для правильного "предъявления" РНК белку ORF2 во время обратной транскрипции. Без ORF1 эффективная ретротранспозиция невозможна.
ORF2: Кодирует большой многофункциональный белок, обладающий двумя ключевыми ферментативными активностями: эндонуклеазной (EN), которая вносит разрыв в ДНК-мишень в месте будущей вставки, и обратнотранскриптазной (RT), которая синтезирует ДНК-копию с РНК-матрицы. А как же другие ферменты, которые были у LTR-элементов (интеграза, РНКаза H, протеаза)? У LINEs ситуация иная. Эндонуклеазная активность ORF2 участвует не только в инициации, но и в процессе интеграции. Специальной интегразы, подобной той, что в гене pol, у LINEs нет; завершение интеграции, вероятно, происходит с участием клеточных систем репарации ДНК. РНКаза H, удаляющая РНК из гибрида, либо не является строго необходимой, либо ее функцию выполняют клеточные ферменты или сам ORF2. А поскольку ORF1 и ORF2 обычно синтезируются как отдельные белки, протеаза для их нарезания, как в случае Gag-Pol, не требуется.

3'-нетранслируемая область (3'-UTR): Содержит сигналы, важные для процессинга РНК, и часто заканчивается поли(А)-последовательностью (поли(А)-хвостом) [25].

Благодаря тому, что LINEs кодируют собственный набор белков (ORF1 и ORF2), необходимых для их мобилизации, они являются автономными элементами. Они не нуждаются в ферментах от других транспозонов для своего перемещения.

Механизм перемещения LINEs также принципиально отличается от LTR-ретротранспозонов. Он не включает образование вирусоподобных частиц. Вместо этого LINEs используют механизм, называемый таргет-праймированной обратной транскрипцией (TPRT). Если кратко (детали мы разберем в Главе 3), то рибонуклеопротеиновый комплекс (РНК + белки ORF1/ORF2) проникает в ядро, белок ORF2 своей эндонуклеазной активностью надрезает одну из цепей ДНК в сайте-мишени, и образовавшийся свободный 3'-OH конец ДНК используется как затравка (праймер) для начала синтеза ДНК обратной транскриптазой ORF2 прямо на РНК-матрице. Этот процесс происходит непосредственно в месте будущей интеграции.

LINEs чрезвычайно широко распространены в геномах эукариот и часто составляют значительную их часть (вспомним 17% генома человека, занятые LINE-1) [9]. Однако важно понимать, что большинство копий LINEs в геноме являются неполноценными. Из-за того, что обратная транскрипция часто обрывается преждевременно, многие копии оказываются укороченными с 5'-конца (5'-трункация). Такие укороченные копии обычно теряют промотор и/или часть кодирующих областей и становятся неспособными к самостоятельному перемещению – это "мертвые" копии [25]. Лишь небольшое число полноразмерных, активных LINE-элементов отвечает за поддержание их присутствия в геноме. Почему же так часто происходит 5'-трункация? Причины могут быть разными: возможно, обратная транскриптаза ORF2 менее "вынослива" и часто отсоединяется от РНК-матрицы, или же сама РНК повреждается в клетке до завершения копирования, либо сложный процесс TPRT сам по себе склонен к преждевременному обрыву синтеза ДНК.

2.2.3. Не-LTR ретротранспозоны: SINEs (структура, неавтономность, зависимость от LINEs)

Помимо длинных автономных LINEs, существует еще одна важная и чрезвычайно многочисленная группа не-LTR ретротранспозонов – SINEs (Short Interspersed Nuclear Elements – Короткие Диспергированные Ядерные Элементы). Как следует из названия, они значительно короче LINEs, их длина обычно составляет от 100 до 500 пар оснований.

Ключевая особенность SINEs – их неавтономность. В отличие от LINEs, SINEs не кодируют никаких белков. У них нет ни открытых рамок считывания (ORF), ни, соответственно, генов обратной транскриптазы, эндонуклеазы или РНК-связывающих белков.

Ответ на вопрос об их перемещении кроется в их хитроумной стратегии "молекулярного паразитизма". SINEs полностью зависят от ферментативной машины, предоставляемой активными LINE-элементами, присутствующими в том же геноме. Для своего перемещения SINEs "угоняют" белки ORF1 и ORF2, синтезированные с полноразмерных копий LINEs. Как происходит этот "угон"? Точные механизмы узнавания еще изучаются, но, по-видимому, РНК SINE (особенно ее 3'-конец и пространственная структура) имитирует сигналы на РНК LINE, позволяя белкам ORF1/ORF2 связываться с ней и использовать для TPRT. РНК-транскрипты SINEs распознаются этими белками, формируют с ними рибонуклеопротеиновые комплексы и затем перемещаются с помощью того же механизма таргет-праймированной обратной транскрипции (TPRT), который используют LINEs. По сути, SINEs эксплуатируют мобильность LINEs для собственного размножения [26].

Несмотря на свою зависимость, SINEs могут быть невероятно успешными в накоплении копий. Самый яркий пример – элементы Alu в геноме человека и других приматов. Как мы помним, их насчитывается более миллиона копий, что значительно превышает число копий их "хозяев" – LINE-1. Почему же "паразиты" могут стать многочисленнее "хозяев"? Возможно, короткие РНК SINE копируются обратной транскриптазой более эффективно (меньше обрывов), чем длинные РНК LINE. Также, РНК SINE, часто считываемые РНК-полимеразой III, могут быть более стабильны или многочисленны в клетке. Наконец, клетки могут лучше переносить накопление коротких SINE, чем длинных LINE. В геномах других млекопитающих (например, грызунов) доминируют другие семейства SINEs, такие как B1 и B2. Но если SINEs не кодируют белки, имеют ли они какое-то значение, кроме занятия места? Безусловно. Их огромное количество оказывает существенное влияние на геном (что мы обсудим в главах 4 и 6). Они могут нарушать гены при встраивании, служить точками для неравной рекомбинации (вызывая делеции или дупликации), влиять на экспрессию соседних генов и даже встраиваться в состав белков путем "экзонизации". Так что, несмотря на отсутствие кодирующей функции, они далеко не нейтральны.

Откуда же произошли SINEs? Считается, что они эволюционировали из обычных клеточных генов, кодирующих малые, стабильные молекулы РНК, которые активно транскрибируются в клетке. Чаще всего их предками являются гены тРНК (транспортной РНК) или, как в случае Alu, ген 7SL РНК (компонент частицы, распознающей сигнальные пептиды). Почему именно они? Главное преимущество – наличие внутренних промоторов РНК-полимеразы III, которые SINEs наследуют. Это обеспечивает высокий уровень их транскрипции, создавая большое количество РНК-копий, готовых к "угону" белками LINEs. А как они приобрели сигналы для LINE-машины? Вероятно, при самом первом событии ретропозиции предковой РНК произошли случайные изменения (например, добавление поли(А)-подобного хвоста или модификация 3'-конца), которые позволили ей "привлечь" белки LINE. Как только такая "мобильная" версия возникла, она смогла распространяться. На 3'-конце SINEs часто несут поли(А)-подобный хвост, который также важен для взаимодействия с аппаратом LINEs.

Таким образом, SINEs представляют собой уникальный пример неавтономных мобильных элементов. Что же произойдет с SINEs, если их 'хозяева' LINEs вымрут? В таком случае SINEs потеряют способность к перемещению и станут просто статичными элементами генома, подверженными мутациям и постепенному удалению, если только в геном не попадет новый совместимый активный LINE. Они достигают огромного эволюционного успеха за счет эксплуатации механизмов мобильности других ретротранспозонов – LINEs.

2.3. Класс II: ДНК-транспозоны (Общая характеристика)

Теперь обратимся ко второму основному классу мобильных генетических элементов – Классу II, или ДНК-транспозонам. Их фундаментальное отличие от ретротранспозонов заключается в том, что они перемещаются по геному непосредственно как молекулы ДНК, без использования промежуточной РНК-копии и, соответственно, без участия фермента обратной транскриптазы.

Ключевую роль в мобильности ДНК-транспозонов играет фермент транспозаза. Автономные ДНК-транспозоны сами кодируют ген своей транспозазы. Этот фермент обладает способностью распознавать специфические последовательности на концах ДНК-транспозона, вырезать элемент из его текущего положения в геноме и встраивать его в новое место.

Характерной структурной особенностью большинства ДНК-транспозонов является наличие концевых инвертированных повторов (TIRs – Terminal Inverted Repeats). Это короткие (обычно 10-50 пар оснований) последовательности ДНК на самых концах элемента, которые идентичны друг другу, но имеют противоположную ориентацию. Зачем нужна такая структура и инверсия? Инвертированная ориентация часто позволяет белкам транспозазы (например, димерам) симметрично связываться с обоими концами элемента одновременно. Сама последовательность ДНК внутри TIR содержит специфические участки, которые транспозаза узнает и к которым прочно присоединяется, позиционируя себя для точного вырезания элемента из генома. Между TIRs располагается область, кодирующая ген транспозазы (у автономных элементов) и, иногда, другие гены ("пассажирские", например, гены устойчивости к антибиотикам у бактериальных транспозонов).

Наиболее распространенный механизм перемещения ДНК-транспозонов – это "вырезать-вставить" (cut-and-paste), также называемый консервативной транспозицией. В этом случае транспозаза вырезает элемент из донорного сайта, оставляя там двуцепочечный разрыв ДНК. Что происходит с этим опасным разрывом? Его "чинят" клеточные системы репарации ДНК. Иногда используется гомологичная хромосома для точного восстановления (HDR), но часто включается быстрый, но неточный механизм (NHEJ), который может оставить после себя небольшие мутации-"шрамы" (инсерции или делеции) в месте бывшей стоянки транспозона. Таким образом, даже "уход" элемента может оставить след в геноме. Вырезанный элемент затем встраивается транспозазой в новый сайт-мишень. При таком механизме общее число копий транспозона в геноме за один акт перемещения не изменяется – элемент просто меняет свое местоположение [4].

Однако существуют и другие, репликативные механизмы транспозиции у некоторых ДНК-транспозонов. Как они копируют ДНК без РНК? Способы бывают разные. Например, некоторые механизмы включают создание одноцепочечных разрывов и использование самого транспозона как матрицы для синтеза новой копии с помощью клеточных ДНК-полимераз, которая затем встраивается в новое место, не удаляя старую копию. Другие элементы, как Helitrons, используют механизм репликации по типу "катящегося кольца". Важно, что копирование происходит с ДНК-матрицы.

ДНК-транспозоны обнаружены у всех групп организмов – и у прокариот, и у эукариот. Они играют важную роль в геномах бактерий, способствуя их адаптации. У эукариот они также внесли свой вклад в эволюцию геномов, хотя в некоторых линиях, например, у человека, большинство ДНК-транспозонов представлены лишь древними неактивными копиями. Почему такая разница с другими видами, где они активны (например, у растений)? Вероятно, это результат сочетания факторов: в линии приматов могли просто "вымереть" активные семейства из-за мутаций, и не было новых "вторжений", либо защитные механизмы генома млекопитающих стали особенно эффективны против ДНК-транспозонов [27].

Таким образом, Класс II представляет собой совершенно иную стратегию мобильности по сравнению с Классом I: перемещение ДНК напрямую, ключевая роль транспозазы и TIRs, и часто (но не всегда) консервативный механизм "вырезать-вставить". В следующих подразделах мы подробнее рассмотрим структуру и разнообразие этих элементов.

2.3.1. Структура: концевые инвертированные повторы (TIRs)

Как мы уже упомянули, визитной карточкой большинства ДНК-транспозонов (Класс II) являются концевые инвертированные повторы (TIRs). Давайте рассмотрим их структуру и функцию немного подробнее.

TIRs – это последовательности ДНК, расположенные на самых концах мобильного элемента. Их ключевая особенность – инвертированная ориентация: последовательность одного TIR является обратной и комплементарной последовательности другого TIR (если читать их от внешнего края элемента к центру). Их длина может сильно варьировать у разных семейств транспозонов – от менее десяти до нескольких сотен пар нуклеотидов. Насколько важна именно инвертированная структура? Для многих классических ДНК-транспозонов она критична, так как облегчает симметричное связывание транспозазы (например, в виде димера) с обоими концами элемента одновременно, что необходимо для скоординированного процесса вырезания или копирования. Однако стоит отметить, что это не единственный возможный механизм мобильности ДНК – существуют и элементы (например, Helitrons, о которых пойдет речь далее), обходящиеся без TIRs и использующие другие сигналы и ферменты.

Самая главная функция TIRs у классических ДНК-транспозонов – служить точными сайтами узнавания и связывания для фермента транспозазы. Именно специфическая последовательность нуклеотидов внутри TIR распознается "своей" транспозазой. Как достигается такая точность узнавания? Это похоже на взаимодействие ключа и замка: ДНК-связывающий домен транспозазы имеет уникальную пространственную структуру, комплементарную форме и химическим свойствам "своего" TIR. Это обеспечивает прочное и специфичное связывание, отличающее "родной" TIR от множества других последовательностей в геноме, включая TIR других семейств транспозонов. Связывание транспозазы с TIRs необходимо для того, чтобы фермент мог правильно позиционироваться и произвести точные разрывы ДНК. Точность разрезания обеспечивается самой структурой фермента: его активный центр, отвечающий за разрыв ДНК, оказывается расположен строго на границе между концом TIR и фланкирующей ДНК хозяина благодаря специфическому связыванию с TIR [28].

Таким образом, целостность и правильная последовательность TIRs абсолютно критичны для мобильности ДНК-транспозона. Мутации внутри TIR могут привести к тому, что транспозаза перестанет узнавать концы элемента, и он потеряет способность к перемещению. Становится ли такой элемент безопасным? В плане мобильности – да, он "обезврежен" и "заморожен" на месте. Однако сама по себе эта неактивная последовательность ДНК может все еще оказывать влияние на геном, например, мешая работе соседних генов или участвуя в других типах рекомбинации, но его основная функция – перемещение – утрачивается.

Хотя основная роль TIRs – это связывание транспозазы и определение границ элемента, иногда они могут нести и дополнительные функции. В некоторых случаях внутри TIR могут располагаться слабые промоторные элементы или сайты связывания белков, влияющие на экспрессию гена транспозазы или на выбор места для встраивания. Однако их первостепенное значение заключается именно в обеспечении структурной целостности элемента и его узнавании специфической транспозазой.

2.3.2. Разнообразие ДНК-транспозонов

Класс II (ДНК-транспозоны) – это не однородная группа, а скорее обширная коллекция разнообразных мобильных элементов, использующих ДНК как посредник при перемещении. Для их классификации используют деление на отряды (orders) и суперсемейства (superfamilies), которое основывается в первую очередь на сходстве аминокислотных последовательностей их транспозаз, а также на общности структурных черт (например, последовательностей TIR) и особенностях механизма транспозиции (например, длине дупликации сайта-мишени, TSD) [6]. Зачем нужна такая детальная классификация? Дело в том, что принадлежность к разным суперсемействам часто означает различия в специфичности узнавания TIR, длине создаваемых TSD, предпочтениях сайтов вставки и даже в самом механизме вырезания/встраивания, что может влиять на их активность и воздействие на геном.

Среди "классических" ДНК-транспозонов, имеющих TIR и кодирующих транспозазу, можно выделить несколько крупных и широко распространенных суперсемейств:

Tc1/mariner: Одно из самых универсальных суперсемейств, представители которого найдены почти во всех типах живых организмов, от бактерий до человека (хотя у человека они неактивны). Они обычно создают дупликацию сайта-мишени длиной 2 п.н. (TA).
hAT: Название происходит от первых открытых представителей – hobo (у дрозофилы), Ac (у кукурузы) и Tam3 (у львиного зева). Эти элементы обычно создают TSD длиной 8 п.н.
P-элементы: Известны у дрозофилы как причина "гибридного дисгенеза" и как инструмент для генетических манипуляций.
MuDR/Mutator: Обнаружены у кукурузы, характеризуются высокой частотой транспозиции. Многие инсерционные последовательности (IS-элементы) прокариот также относятся к различным суперсемействам ДНК-транспозонов [6].

Однако мир ДНК-транспозонов не ограничивается элементами с TIR и классической транспозазой. Существуют и весьма необычные группы:

Helitrons: Эти элементы не имеют TIR и не кодируют типичную транспозазу. Вместо этого они перемещаются по репликативному механизму "катящегося кольца", используя ферменты с активностями ДНК-хеликазы и нуклеазы-лигазы [29]. Как они "захватывают" гены? Их механизм "катящегося кольца", по-видимому, позволяет репликации иногда "проскакивать" конец элемента и копировать соседние участки ДНК хозяина (например, экзоны генов) вместе с самим Helitron'ом. Эти захваченные фрагменты затем встраиваются в новое место вместе с копией элемента, способствуя "перетасовке" генных модулей в геноме.
Polintons (также известные как Mavericks): Это гигантские ДНК-транспозоны (~15-20 тысяч пар нуклеотидов и более). Они обладают уникальным набором генов, кодируя собственную ДНК-полимеразу типа B (PolB), интегразу, АТФазу, протеазу и даже белки, похожие на структурные белки вирусов [30]. Предполагается, что они реплицируются с использованием белковой затравки и ДНК-полимеразы PolB, возможно, формируя внутри клетки вирусоподобные частицы. Так это транспозоны или ДНК-вирусы? Polintons действительно стирают границы между этими категориями. Их относят к транспозонам, так как они являются постоянными жителями генома и перемещаются внутри него, но их сложный набор генов явно указывает на общее или конвергентное происхождение с некоторыми ДНК-вирусами. Отсутствие доказательств формирования ими полноценных инфекционных частиц отличает их от классических вирусов.

Но если Helitrons и Polintons так не похожи на классические ДНК-транспозоны, почему их все же относят к Классу II? Главный объединяющий признак – то, что весь их жизненный цикл и перемещение основаны исключительно на манипуляциях с ДНК. Ни Helitrons, ни Polintons не используют РНК как промежуточную копию для перемещения и не нуждаются в обратной транскриптазе, что кардинально отличает их от ретротранспозонов Класса I.

Таким образом, Класс II ДНК-транспозонов демонстрирует огромное разнообразие как структур, так и механизмов мобильности – от относительно простых элементов, работающих по принципу "вырезать-вставить", до сложных систем, напоминающих вирусы или использующих уникальные способы репликации ДНК.

2.4. Автономные и неавтономные элементы: общая концепция

Мы уже несколько раз сталкивались с ситуациями, когда одни мобильные элементы могут перемещаться сами по себе, а другие нуждаются для этого в "помощи" со стороны. Эта зависимость лежит в основе еще одного важного принципа классификации транспозонов, применимого к обоим классам (I и II): деления на автономные и неавтономные элементы.

Способность транспозона к перемещению напрямую зависит от наличия функциональных белков (ферментов), которые осуществляют этот процесс – обратной транскриптазы и эндонуклеазы у LINEs, транспозазы у ДНК-транспозонов, интегразы у LTR-элементов и т.д.

Автономные элементы – это те транспозоны, которые содержат в своей последовательности все необходимые гены и кодируют полный набор функциональных белков, требующихся для их собственного перемещения. Примеры автономных элементов – это активные полноразмерные LINE-1, элемент Ac у кукурузы, многие ДНК-транспозоны с неповрежденным геном транспозазы. Они, как автомобиль с исправным двигателем, могут передвигаться самостоятельно.
Неавтономные элементы – это транспозоны, которые утратили способность кодировать один или несколько функциональных белков, необходимых для мобильности. Чаще всего это происходит из-за делеций (потери части последовательности) или накопления мутаций в кодирующих областях. Как они возникают? Считается, что подавляющее большинство неавтономных элементов – это "потомки" ранее активных автономных элементов, которые "сломались", потеряв часть своей кодирующей последовательности, но сохранив сигналы, необходимые для перемещения. Однако такие элементы обычно сохраняют на своих концах сигнальные последовательности (TIRs у ДНК-элементов, специфические участки на 3'-конце у SINEs), которые могут быть распознаны белками, кодируемыми родственными автономными элементами. Классические примеры неавтономных элементов – это SINEs (включая Alu), элемент Ds у кукурузы [4].

Как же перемещаются неавтономные элементы? Они полностью зависят от белков, производимых автономными элементами, находящимися в той же клеточной среде. Если в клетке присутствует активный автономный элемент, его белки могут распознать сигналы на неавтономном элементе и осуществить его мобилизацию in trans (то есть действуя на другую молекулу). Насколько строгая эта "родственная" связь? Обычно довольно строгая: белки (транспозаза или белки LINE) специфично узнают сигнальные последовательности (TIRs или концы РНК) элементов своего семейства или, реже, близкого суперсемейства. Ферменты от одного семейства, как правило, не могут мобилизовать элементы другого, даже если те имеют похожую структуру. Таким образом, автономный элемент выступает в роли "тягача" для своих неавтономных "родственников". Этот процесс "поломки" автономных элементов и превращения их в неавтономные является постоянным источником последних в геноме. А возможен ли обратный путь? Восстановление автономии неавтономным элементом (например, путем точного встраивания недостающих генов) считается крайне маловероятным событием по сравнению с частой потерей функции из-за мутаций.

Ярким примером неавтономных ДНК-транспозонов (Класс II) являются MITEs (Miniature Inverted-repeat Transposable Elements). Это короткие элементы, которые имеют характерные TIRs на концах, но не кодируют ген транспозазы. Они могут перемещаться только в присутствии активных автономных ДНК-транспозонов из того же суперсемейства, которые предоставляют им необходимую транспозазу [31]. Несмотря на свою зависимость, MITEs могут достигать чрезвычайно высоких копий в геномах некоторых организмов, особенно у растений.

Концепция автономии и неавтономии помогает понять сложную динамику популяций транспозонов внутри генома. Часто неавтономные элементы оказываются гораздо более многочисленными, чем их автономные "хозяева". В чем причина такого успеха "паразитов"? Вероятно, их малый размер способствует более эффективному копированию или перемещению. Кроме того, не кодируя белков, они могут быть менее "токсичны" для клетки, позволяя ей выдерживать большее их количество. Эффективная транскрипция (у SINEs) и оптимизированные сигналы для "угона" ферментов также вносят свой вклад. Это подчеркивает эффективность "паразитической" стратегии: достаточно одного активного "мастера" (автономного элемента), чтобы мобилизовать целую армию зависимых от него неавтономных копий.

2.5. Транспозоны у прокариот: IS-элементы и композитные транспозоны

До сих пор мы в основном говорили о транспозонах эукариот, но мобильные генетические элементы играют не менее важную, а возможно, и более динамичную роль в жизни прокариот – бактерий и архей. Хотя у прокариот встречаются аналоги некоторых ретроэлементов, доминирующей силой в их геномах являются ДНК-транспозоны (Класс II). Они вносят огромный вклад в пластичность прокариотических геномов, их адаптацию к изменяющимся условиям и горизонтальный перенос генов.

Простейшими и наиболее распространенными ДНК-транспозонами у прокариот являются инсерционные последовательности или IS-элементы. Это компактные мобильные единицы, обычно размером от 0.7 до 2.5 тысяч пар нуклеотидов. Их структура минималистична:

Ген (или гены), кодирующий транспозазу.
Короткие концевые инвертированные повторы (TIRs), фланкирующие ген транспозазы. Почему такая простота? Вероятно, это минимальный набор, необходимый для автономной ДНК-транспозиции. IS-элементы полагаются на клеточные механизмы для всего остального (репликация, репарация). Их компактность может быть выгодна в быстро делящихся прокариотических клетках с относительно небольшими геномами [32].

IS-элементы являются автономными, так как сами кодируют фермент, необходимый для их перемещения (обычно по механизму "вырезать-вставить", но встречаются и репликативные варианты). Встраиваясь в новые места генома, они могут вызывать мутации, нарушая гены или их регуляторные области. Рекомбинация между множественными копиями IS-элементов в геноме также может приводить к делециям, инверсиям и другим перестройкам.

Однако гораздо большее значение для адаптации прокариот имеют более сложные структуры, образованные на основе IS-элементов – композитные (или составные) транспозоны (Tn). Структура такого транспозона представляет собой:

Центральную область, содержащую один или несколько "пассажирских" генов (не связанных с транспозицией). Очень часто это гены устойчивости к антибиотикам, но могут быть и гены, отвечающие за метаболизм определенных веществ, устойчивость к тяжелым металлам и т.д.
Два IS-элемента (обычно одного и того же типа), фланкирующие эту центральную область. Копии IS могут быть ориентированы как в инвертированной, так и в прямой ориентации относительно друг друга. Как возникает такая структура? Считается, что это результат двух независимых событий встраивания IS-элементов одного семейства по обе стороны от участка генома с "пассажирскими" генами. Учитывая мобильность и часто множественные копии IS-элементов, такие случайные события со временем могут приводить к формированию композитных транспозонов.

Как перемещается такая конструкция? Транспозаза, кодируемая одним или обоими фланкирующими IS-элементами, распознает самые внешние TIRs всего композитного транспозона и перемещает весь блок [IS – пассажирские гены – IS] как единое целое. Почему используются внешние TIRs, а не внутренние? Хотя и отдельные IS-элементы могут перемещаться, механизмы сборки комплекса транспозазы на ДНК часто способствуют взаимодействию именно с наиболее удаленными, правильно ориентированными концами (TIRs), что обеспечивает преимущественное перемещение всей структуры как единого целого. Таким образом, IS-элементы здесь выступают не только как самостоятельные мобильные единицы, но и как модули, обеспечивающие мобильность для других генов. Именно композитные транспозоны являются одним из главных механизмов быстрого распространения генов устойчивости к антибиотикам между различными бактериями, часто через плазмиды – небольшие кольцевые молекулы ДНК, способные передаваться от клетки к клетке (горизонтальный перенос генов) [33]. Какая выгода от этого самому транспозону? Перенося "полезный" для бактерии ген, транспозон повышает шансы на выживание и размножение своего хозяина в определенных условиях (например, при наличии антибиотика). Успех хозяина означает и успех (сохранение и распространение) транспозона, который он несет. Таким образом, транспозон "путешествует автостопом" на пользе, приносимой "пассажирским" геном.

Помимо композитных транспозонов, существуют и другие типы бактериальных транспозонов, например, юнит-транспозоны (семейство Tn3 и др.), которые не фланкированы полными IS-элементами, но содержат между своими собственными TIRs гены транспозазы, резольвазы (фермента, участвующего в репликативной транспозиции) и часто "пассажирские" гены. Они обычно перемещаются по репликативному механизму.

В целом, мобильные генетические элементы – IS-элементы и различные типы транспозонов (Tn) – являются ключевыми факторами, определяющими динамику и эволюцию геномов прокариот, позволяя им быстро адаптироваться к новым условиям и обмениваться важными генетическими детерминантами.

Глава 3: Механизмы транспозиции: как "прыгают" гены

3.1. Ретротранспозиция: механизм "копировать-вставить"

В предыдущей главе мы узнали, что транспозоны Класса I, или ретротранспозоны, перемещаются по геному через промежуточную РНК-копию. Этот процесс, называемый ретротранспозицией, фундаментально отличается от прямого перемещения ДНК, характерного для Класса II. Ключевая особенность ретротранспозиции заключается в том, что исходный элемент остается на своем месте в геноме, а в новое место встраивается его дополнительная копия, синтезированная с РНК-матрицы. Именно поэтому данный механизм называют "копировать-вставить" (copy-and-paste), и именно он отвечает за способность ретротранспозонов многократно увеличивать свое число в геноме [34].

Хотя детали могут значительно различаться у разных типов ретротранспозонов (LTR и не-LTR), общая схема процесса включает несколько основных этапов, особенно хорошо прослеживаемых у эукариот:

Транскрипция: Интегрированная в геном ДНК-копия ретротранспозона считывается (транскрибируется) клеточной РНК-полимеразой (обычно РНК-полимеразой II для LTR и LINEs, или РНК-полимеразой III для SINEs), в результате чего образуется молекула РНК – точная копия элемента.
Процессинг и экспорт РНК (в эукариотических клетках): Образовавшаяся РНК-копия часто подвергается некоторому процессингу (например, полиаденилированию) и затем транспортируется из ядра в цитоплазму. В цитоплазме происходит синтез белков, кодируемых автономными ретротранспозонами. Как происходят эти перемещения через ядерную оболочку? Ретротранспозоны обычно эксплуатируют стандартные клеточные пути: их РНК экспортируется подобно мРНК.
Обратная транскрипция: Ключевой этап, на котором РНК-копия элемента используется как матрица для синтеза комплементарной ей ДНК (кДНК). Эту реакцию катализирует фермент обратная транскриптаза (RT), который должен быть доступен в этот момент. Важно помнить, что RT склонна к ошибкам. Существуют ли способы исправить эти ошибки до интеграции? Как правило, нет. В отличие от клеточных ДНК-полимераз, RT не имеет корректирующей активности, и системы репарации клетки обычно не "чинят" ДНК-копию до ее встраивания. Поэтому мутации, возникшие при обратной транскрипции, в большинстве случаев закрепляются в новой копии в геноме. Место, где происходит обратная транскрипция, различается у разных типов ретроэлементов. Почему такие разные стратегии? Они отражают разное эволюционное происхождение и "логику" работы. У LTR-ретротранспозонов это обычно происходит в цитоплазме внутри вирусоподобных частиц (близко к стратегии ретровирусов). У LINEs/SINEs – вероятно, уже в ядре, непосредственно в месте будущей вставки (при TPRT, что является более "экономичным" путем, не требующим сборки частиц).
Транспорт в ядро (в эукариотических клетках): Новосинтезированная ДНК-копия (часто в комплексе с белками, включая интегразу или белок ORF2) должна попасть обратно в ядро. Белки, необходимые для интеграции (или комплекс ДНК-белок), несут специальные сигналы ядерной локализации (NLS), которые распознаются клеточной системой импорта в ядро через ядерные поры. (Этот этап не требуется, если обратная транскрипция произошла уже в ядре).
Интеграция: ДНК-копия ретротранспозона встраивается (интегрируется) в новый участок геномной ДНК. Этот процесс катализируется либо интегразой (у LTR-элементов), либо эндонуклеазной активностью белка ORF2 (у LINEs и SINEs). Куда именно происходит встраивание? Хотя вставки могут происходить во многие места генома, процесс не является абсолютно случайным. Разные ретротранспозоны демонстрируют определенные предпочтения к сайтам интеграции – некоторые чаще попадают в межгенные участки, другие – в интроны или рядом с определенными генами, что может быть связано со структурой хроматина или специфичностью интегразы/ORF2. Этот аспект мы рассмотрим подробнее при обсуждении конкретных механизмов и последствий транспозиции (Главы 3 и 4).

Центральным ферментом всего процесса является обратная транскриптаза, без которой ретротранспозиция невозможна. Однако для полного цикла необходимы и другие активности – РНКазы H (для удаления РНК из гибрида РНК:ДНК), эндонуклеазы/интегразы (для разрезания ДНК-мишени и встраивания новой копии), а также РНК-связывающие белки (для упаковки и защиты РНК-интермедиата).

Несмотря на общность схемы, конкретные молекулярные машины и стратегии, используемые LTR-ретротранспозонами и не-LTR ретротранспозонами (LINEs/SINEs), имеют существенные различия, особенно на этапах обратной транскрипции и интеграции. Эти различия мы подробно рассмотрим в следующих подразделах.

3.1.1. Ключевые ферменты ретротранспозиции: РТ и ДНК-модифицирующие энзимы

Успешная ретротранспозиция – сложный многостадийный процесс, требующий участия специфических ферментов, которые часто кодируются самими автономными ретроэлементами. Хотя клеточные белки тоже вносят свой вклад (например, РНК-полимеразы для транскрипции), ключевые этапы – создание ДНК-копии с РНК и ее встраивание в геном – катализируются специализированными ферментами самого транспозона. Рассмотрим основные из них.

Обратная транскриптаза (RT - Reverse Transcriptase) Это, без сомнения, главный и определяющий фермент всех ретроэлементов (Класс I). Его уникальная функция – синтезировать молекулу ДНК, используя в качестве матрицы молекулу РНК (РНК-зависимая ДНК-полимеразная активность). Без обратной транскриптазы ретротранспозиция невозможна. Часто белок RT обладает также РНКазной H активностью. Зачем удалять РНК? Этот домен отвечает за расщепление исходной РНК-матрицы в составе гибридной молекулы РНК:ДНК, которая образуется в ходе обратной транскрипции. Это важно, так как оставшаяся РНК мешала бы синтезу второй цепи ДНК и, возможно, интеграции [35]. Как мы помним, RT также характеризуется относительно низкой точностью, внося ошибки при синтезе ДНК. Это "баг" или "фича"? Вероятно, и то, и другое. С одной стороны, отсутствие механизмов коррекции ошибок (как у клеточных ДНК-полимераз) – это биохимическое ограничение RT. С другой стороны, возникающие мутации создают разнообразие копий, помогая уклоняться от защиты хозяина, и в то же время приводят к быстрой инактивации большинства копий, что может служить своего рода "самоограничением", предотвращающим гибель хозяина от избытка транспозонов.
Ферменты для интеграции: Интеграза (IN) или Эндонуклеаза (EN) Просто синтезировать ДНК-копию недостаточно, ее нужно еще встроить в геном хозяина. Для этого необходимо внести разрывы в ДНК-мишень и затем соединить концы транспозонной ДНК с разорванными концами ДНК хозяина. Ретроэлементы используют для этого две основные стратегии, связанные с разными ферментами:

Интеграза (IN): Этот фермент характерен для LTR-ретротранспозонов и ретровирусов. Он обычно кодируется геном pol вместе с RT и PR. Интеграза распознает специфические последовательности на концах обработанной двуцепочечной ДНК-копии ретроэлемента (кДНК). Затем она вносит ступенчатые (смещенные) разрывы в обе цепи ДНК-мишени и катализирует реакцию псевдо-трансэтерификации, присоединяя 3'-концы кДНК к 5'-концам разорванной ДНК-мишени. Оставшиеся бреши и одноцепочечные участки затем репарируются клеточными ферментами, что приводит к полной интеграции элемента и образованию характерных дупликаций сайта-мишени (TSDs) [36].
Эндонуклеаза (EN), сопряженная с RT: Эта стратегия используется не-LTR ретротранспозонами (LINEs и SINEs, мобилизуемые ими). Здесь обе ключевые активности – и эндонуклеазная, и обратнотранскриптазная – часто содержатся в одном большом белке, кодируемом ORF2 (у LINEs). Эндонуклеазный домен вносит одноцепочечный разрыв (ник) в ДНК-мишень. Затем происходит самое интересное: образовавшийся свободный 3'-OH конец хозяйской ДНК используется RT-доменом того же белка как затравка (праймер) для начала синтеза первой цепи ДНК ретротранспозона прямо с его РНК-матрицы [25]. Использование ДНК-затравки для синтеза ДНК с РНК-матрицы – это необычная биохимическая особенность RT этих элементов, ключевая для механизма TPRT (таргет-праймированная обратная транскрипция). Последующие этапы (разрыв второй цепи ДНК-мишени, синтез второй цепи ДНК элемента, лигирование) менее изучены, но, вероятно, также включают действие ORF2 и клеточных репарационных систем.

Другие ферменты У LTR-ретротранспозонов и ретровирусов важную роль играет протеаза (PR), также кодируемая геном pol. Она необходима для нарезания полипротеинов Gag и Gag-Pol на функциональные индивидуальные белки [37]. У не-LTR элементов, где ORF1 и ORF2 обычно синтезируются раздельно, такая протеаза не требуется.

Таким образом, хотя обратная транскриптаза является универсальным атрибутом ретротранспозиции, механизмы взаимодействия с ДНК-мишенью и интеграции новой копии существенно различаются и определяются наличием либо интегразы (у LTR-элементов), либо эндонуклеазы, функционально сопряженной с RT (у не-LTR элементов). Какой способ "лучше"? Сложно сказать однозначно. Оба механизма оказались чрезвычайно успешными в эволюции. Путь с интегразой напоминает вирусный и работает с готовой ДНК-копией, тогда как TPRT тесно связывает синтез ДНК с местом вставки, что может быть экономичнее по числу требуемых белков.

3.1.2. Механизм TPRT (Target-Primed Reverse Transcription) для LINEs и SINEs

Теперь давайте детально разберем механизм ретротранспозиции, характерный для не-LTR ретротранспозонов – LINEs и зависимых от них SINEs. Этот элегантный и экономичный процесс называется таргет-праймированной обратной транскрипцией (TPRT), или обратной транскрипцией, инициируемой сайтом-мишенью. Он принципиально отличается от механизма LTR-элементов отсутствием вирусоподобных частиц и тесной связью между разрезанием ДНК-мишени и синтезом ДНК-копии транспозона. Весь процесс, по-видимому, происходит преимущественно в ядре клетки.

Ключевым участником событий является рибонуклеопротеиновый комплекс (РНП). У автономных LINEs он состоит из РНК-копии самого LINE-элемента, плотно связанной с кодируемыми им белками ORF1 и ORF2. У неавтономных SINEs РНП содержит РНК SINE, "упакованную" белками ORF1 и ORF2, "позаимствованными" у активного LINE. Этот РНП-комплекс находит путь к геномной ДНК. Какова роль ORF1 в дальнейших событиях? Считается, что ORF1 важен для защиты РНК, транспорта РНП в ядро и, возможно, для первичного контакта с ДНК-мишенью, но непосредственно в каталитических актах разрезания ДНК и синтеза кДНК главную роль играет ORF2.

Процесс TPRT можно разбить на следующие основные этапы:

Узнавание сайта-мишени и первый разрыв ДНК: РНП-комплекс связывается с участком ДНК-мишени в геноме. Эндонуклеазный (EN) домен белка ORF2 распознает предпочтительную, хотя часто довольно вариабельную, последовательность нуклеотидов (например, у человеческого LINE-1 это часто последовательность богатая Т/А, вида TTTT/A) и вносит одноцепочечный разрыв (ник) в одну из цепей ДНК. Но таких мест в геноме миллионы, значит ли это, что вставка случайна? Не совсем. Хотя само узнавание мотива не очень строгое, выбор сайта-мишени также сильно зависит от доступности ДНК (например, открытый эухроматин предпочтительнее закрытого гетерохроматина) и, возможно, от локальной структуры ДНК. Кроме того, итоговое распределение вставок в популяции определяется и отбором, удаляющим наиболее вредные инсерции. При разрыве образуется свободный 3'-гидроксильный (3'-OH) конец на разорванной цепи ДНК хозяина.
Праймирование и синтез первой цепи кДНК: Происходит ключевое событие TPRT. Освободившийся 3'-OH конец хозяйской ДНК используется как затравка (праймер) доменом обратной транскриптазы (RT) того же белка ORF2. Часто 3'-конец РНК транспозона (несущий поли(А)-хвост) спаривается с комплементарным Т-богатым участком ДНК-мишени рядом с местом разрыва. RT домен начинает синтезировать первую цепь комплементарной ДНК (кДНК), двигаясь вдоль РНК-матрицы транспозона от ее 3'-конца к 5'-концу [38].
Разрыв второй цепи ДНК-мишени: По мере продвижения RT или после завершения синтеза первой цепи кДНК, эндонуклеазный домен ORF2 (или, возможно, другой механизм) вносит второй одноцепочечный разрыв на противоположной цепи ДНК-мишени. Этот второй разрыв обычно происходит на некотором расстоянии (несколько нуклеотидов) от первого, создавая "ступеньку".
Удаление РНК-матрицы и синтез второй цепи кДНК: Исходная РНК-матрица удаляется из гибрида РНК:ДНК (вероятно, с участием клеточных РНКаз H). Затем происходит синтез второй цепи кДНК. Механизмы этого этапа изучены хуже всего. Почему? Вероятно, здесь происходит сложная координация между ORF2 и различными клеточными системами репарации ДНК, которые достраивают вторую цепь, заполняют бреши и сшивают концы. Сложность изучения связана с необходимостью участия многих клеточных факторов и кратковременностью промежуточных стадий.
Завершение интеграции и образование TSDs: Встраивание двуцепочечной кДНК завершается, вероятно, при участии клеточных систем репарации ДНК, которые лигируют (сшивают) концы новой копии с ДНК-мишенью и заполняют одноцепочечные бреши, возникшие из-за ступенчатых разрывов. Заполнение этих брешей приводит к дупликации короткого участка ДНК хозяина, который изначально находился между двумя сайтами разрыва – так образуются прямые повторы сайта-мишени (TSDs), фланкирующие интегрировавшийся элемент. Длина TSDs является характерной чертой для эндонуклеаз разных семейств LINEs.

Из-за особенностей механизма TPRT, в частности, возможного преждевременного отсоединения RT от РНК-матрицы, многие новые копии LINEs оказываются укороченными с 5'-конца (5'-трункация) [39]. Как это связано с TPRT? Обрыв синтеза чаще всего происходит во время синтеза первой цепи кДНК (этап 2). Обратная транскриптаза ORF2 может преждевременно "отвалиться" от РНК-матрицы из-за ее структуры, повреждений или собственной невысокой "выносливости" (процессивности). Поскольку синтез идет от 3'- к 5'-концу РНК, обрыв приводит к потере 5'-части элемента в новой ДНК-копии.

Таким образом, TPRT представляет собой уникальный механизм ретротранспозиции, тесно сопрягающий разрезание ДНК-мишени с праймированием обратной транскрипции непосредственно в месте будущей интеграции, что отличает его от LTR-опосредованных механизмов.

3.1.3. Механизм LTR-ретротранспозонов (Сходство с ретровирусной интеграцией)

Механизм перемещения LTR-ретротранспозонов существенно отличается от TPRT, используемого LINEs и SINEs, и демонстрирует поразительное сходство с жизненным циклом ретровирусов (таких как ВИЧ), особенно на внутриклеточных стадиях. Ключевыми особенностями этого пути являются образование вирусоподобных частиц (VLP) и участие фермента интегразы.

Процесс можно описать следующими этапами:

Транскрипция и синтез белков: С ДНК-копии LTR-элемента (протранспозона), интегрированной в геном, с помощью клеточной РНК-полимеразы II считывается полноразмерная РНК-копия. Транскрипция инициируется промотором в 5'-LTR и терминируется с использованием сигнала полиаденилирования в 3'-LTR. Эта РНК выполняет двойную функцию: она служит матрицей для синтеза белков Gag и Pol (в цитоплазме) и одновременно является геномной РНК, которая будет упакована в новые частицы.
Формирование вирусоподобных частиц (VLP): Белки Gag спонтанно собираются в цитоплазме, образуя частицу, напоминающую вирусный капсид (VLP). Внутрь этой частицы упаковываются:

Две копии геномной РНК ретротранспозона. Зачем две? Наличие двух РНК (димерный геном), как и у ретровирусов, повышает надежность: если одна РНК повреждена, RT может переключиться на вторую. Это также позволяет происходить рекомбинации между копиями.
Белок Pol (часто в виде предшественника Gag-Pol), содержащий обратную транскриптазу (RT), РНКазу H и интегразу (IN).
Молекула специфической клеточной тРНК, которая была "захвачена" и будет служить затравкой (праймером) для начала обратной транскрипции. Почему именно тРНК? Использование стабильной и многочисленной клеточной молекулы – это "экономная" стратегия, избавляющая от необходимости кодировать собственный праймер. РНК транспозона содержит специальный участок (PBS), комплементарный определенной тРНК, что обеспечивает специфичность связывания [23].

Обратная транскрипция внутри VLP: Весь сложный процесс синтеза ДНК с РНК-матрицы происходит внутри VLP, в контролируемом микроокружении. Он включает несколько стадий:

Инициация: Молекула тРНК связывается с PBS на геномной РНК и используется RT как затравка для синтеза короткого фрагмента первой (минус) цепи ДНК.
Первый "прыжок" цепи: Синтез доходит до 5'-конца РНК. РНКаза H разрушает РНК в гибриде РНК:ДНК. Короткая минус-цепь ДНК переносится на 3'-конец той же или второй молекулы РНК (используя короткие повторы R) и синтез продолжается.
Синтез плюс-цепи: По мере синтеза минус-цепи ДНК, РНКаза H разрушает РНК-матрицу, оставляя устойчивый фрагмент (PPT), который используется как затравка для синтеза второй (плюс) цепи ДНК на матрице минус-цепи ДНК.
Завершение и образование LTR: Дополнительные этапы, включая возможный второй "прыжок", приводят к образованию линейной двуцепочечной молекулы ДНК (кДНК), фланкированной двумя идентичными, полностью сформированными LTR. Зачем нужны эти сложные "прыжки"? Они необходимы для решения двух задач: во-первых, чтобы RT смогла скопировать всю РНК от конца до конца, и во-вторых, – и это главное – чтобы на концах финальной ДНК-копии сформировались полные LTR (содержащие участки U3, R и U5), даже если на концах исходной РНК были только их части. Именно "прыжки" позволяют "достроить" LTR [35].

Транспорт в ядро: Образовавшаяся кДНК вместе с интегразой и другими белками образует преинтеграционный комплекс (PIC), который транспортируется из цитоплазмы в ядро клетки.
Интеграция с помощью Интегразы: В ядре фермент интеграза (IN) катализирует встраивание линейной кДНК в геном хозяина. Она сначала немного подрезает 3'-концы кДНК, а затем узнает участок на ДНК-мишени. Насколько случаен этот выбор? Интеграция не абсолютно случайна. Хотя LTR-элементы могут встраиваться во многие места, часто наблюдаются предпочтения: некоторые семейства тяготеют к активным генам, другие – к определенным структурам хроматина. Выбор сайта зависит от взаимодействия интегразы (и связанных с ней клеточных белков) с ДНК и хроматином хозяина. Интеграза вносит ступенчатые разрывы в ДНК-мишень и ковалентно присоединяет концы кДНК к концам разорванной ДНК хозяина (реакция переноса цепи). Клеточные системы репарации затем заполняют одноцепочечные бреши, что приводит к образованию коротких прямых повторов сайта-мишени (TSDs) по бокам от встроившегося элемента [36].

Таким образом, механизм LTR-ретротранспозонов включает сложную серию событий, во многом повторяющую репликацию ретровирусов внутри клетки: упаковку РНК в частицы, обратную транскрипцию с "прыжками" цепей внутри частиц для генерации LTR и интеграцию линейной двуцепочечной ДНК с помощью интегразы. Это кардинально отличает их от не-LTR элементов с их механизмом TPRT.

3.2. ДНК-транспозиция: механизм "вырезать-вставить" и другие

Перейдем теперь к механизмам перемещения транспозонов Класса II, или ДНК-транспозонов. Как мы помним, их фундаментальное отличие от ретротранспозонов заключается в том, что они перемещаются непосредственно в виде ДНК, без использования промежуточной РНК-копии и, соответственно, без участия фермента обратной транскриптазы. Центральную роль в этом процессе играют фермент транспозаза и концевые инвертированные повторы (TIRs) на концах элемента.

Существует несколько вариантов ДНК-транспозиции, но наиболее изученным и распространенным является консервативный механизм "вырезать-вставить" (cut-and-paste). Он включает следующие основные этапы:

Связывание транспозазы: Молекулы транспозазы распознают и связываются со специфическими последовательностями внутри TIRs на обоих концах ДНК-транспозона.
Вырезание (эксцизия): Связавшийся комплекс транспозазы вносит двуцепочечные разрывы в ДНК точно по границам транспозона, отделяя (вырезая) его от исходного донорного сайта в хромосоме. На донорском сайте остается двуцепочечный разрыв.
Формирование транспосомы и перенос к мишени: Вырезанный ДНК-элемент обычно остается связанным с комплексом транспозазы, образуя структуру, называемую транспосомой. Находясь в этом комплексе, ДНК элемента, вероятно, защищена от деградации клеточными нуклеазами благодаря связанным белкам транспозазы. Этот комплекс затем находит новый участок в геноме – сайт-мишень.
Атака на ДНК-мишень: Транспозаза в составе транспосомы вносит разрывы (часто ступенчатые) в ДНК сайта-мишени. Как выбирается это место? Выбор сайта редко бывает абсолютно случайным. Хотя многие ДНК-транспозоны могут встраиваться во множество мест, часто наблюдаются определенные, хоть и слабые, предпочтения к локальным последовательностям ДНК, структуре хроматина или даже к соседству с другими белками на ДНК. Абсолютно специфичного таргетинга обычно нет, но и полной случайности тоже.
Интеграция (лигазная реакция): Концы вырезанного ДНК-транспозона присоединяются (лигируются) к разорванным концам ДНК-мишени. Эту реакцию катализирует сама транспозаза.
Репарация: Образовавшиеся разрывы на донорском сайте и одноцепочечные бреши на сайте-мишени репарируются клеточными системами репарации ДНК. Репарация донорного сайта часто происходит с ошибками (через NHEJ). Почему с ошибками? Клетка имеет точные механизмы репарации (HDR), но они требуют наличия копии-шаблона и активны не всегда. Быстрый, но неточный механизм NHEJ может "склеить" разорванные концы без шаблона, но при этом часто вносит небольшие инсерции или делеции (инделы). Эти мутации, остающиеся как "шрам" или "след" от транспозона, могут нарушить ген, если элемент вырезался из его кодирующей или регуляторной области. Репарация сайта-мишени приводит к заполнению брешей и формированию коротких прямых повторов сайта-мишени (TSDs) по бокам от встроившегося элемента [28].

Поскольку при этом механизме сам ДНК-элемент физически перемещается с одного места на другое, общее число его копий в геноме за один акт транспозиции не изменяется. Поэтому его называют консервативным.

Однако механизм "вырезать-вставить" – не единственный способ перемещения для ДНК-транспозонов. Существуют также репликативные механизмы ДНК-транспозиции. При таких механизмах исходная копия элемента остается на месте, а новая копия синтезируется (используя ДНК-матрицу) и встраивается в сайт-мишень, что приводит к увеличению числа копий [27]. Почему существуют оба типа – консервативный и репликативный? "Вырезать-вставить" проще и, возможно, менее затратно для клетки, но несет риск потери элемента при неудачной интеграции или репарации донорного сайта. Репликативный путь гарантирует сохранение исходной копии и напрямую увеличивает число копий, что выгодно для распространения транспозона, но может быть более "дорогим" или опасным для хозяина. Сохранение обоих механизмов в эволюции говорит об их сравнимой успешности в разных условиях. Кроме того, существуют элементы вроде Helitrons, использующие совершенно особый репликативный механизм "катящегося кольца".

Несмотря на это разнообразие, все механизмы Класса II объединяет то, что мобильной единицей является сама ДНК, а ключевую роль играют белки (транспозазы или другие ферменты), напрямую манипулирующие ДНК, в отличие от РНК-зависимых процессов ретротранспозиции. В следующих подразделах мы подробнее остановимся на некоторых ключевых аспектах этих ДНК-опосредованных механизмов.

3.2.1. Роль транспозазы

Центральным "мотором", приводящим в движение большинство ДНК-транспозонов (Класс II), является фермент транспозаза. Этот белок, как правило, кодируется самим транспозоном (в случае автономных элементов) и выполняет все ключевые каталитические шаги, необходимые для перемещения ДНК-последовательности с одного места генома в другое при механизме "вырезать-вставить". Транспозаза – это удивительно многофункциональный белок.

Основные функции транспозазы включают:

Узнавание и связывание с ДНК: Транспозаза обладает специфическим ДНК-связывающим доменом, который точно распознает и связывается с последовательностями концевых инвертированных повторов (TIRs) своего "родного" транспозона.
Формирование синаптического комплекса: Молекулы транспозазы (часто несколько) связываются с обоими TIRs транспозона и сближают их в пространстве, образуя стабильный синаптический комплекс, или транспосому.
Катализ вырезания (эксцизии): Транспозаза содержит каталитический домен, который отвечает за разрыв фосфодиэфирных связей в молекуле ДНК, производя точные двуцепочечные разрывы по границам элемента.
Взаимодействие с ДНК-мишенью и интеграция: Транспосома связывается с сайтом-мишенью, каталитический домен транспозазы вносит разрывы в ДНК-мишень и катализирует реакцию переноса цепи (strand transfer) – ковалентное присоединение концов ДНК транспозона к концам разорванной ДНК-мишени [28].

Как один белок справляется со всем этим? Транспозаза обычно имеет модульную структуру: разные домены отвечают за связывание ДНК (узнавание TIRs), за взаимодействие с другими молекулами транспозазы (сборка комплекса) и за катализ (разрезание/сшивание ДНК). Белок претерпевает изменения формы на разных этапах, активируя нужную функцию в нужный момент.

Интересно, что каталитические домены многих транспозаз (а также ретровирусных интеграз) содержат консервативный мотив из трех аминокислотных остатков – двух аспартатов (D) и одного глутамата (E), или трех аспартатов (DDD), – так называемый DDE/DDD-мотив. Эти аминокислоты координируют ионы металлов (обычно Mg²⁺ или Mn²⁺), которые необходимы для катализа [40]. Что означает наличие этого мотива у разных ферментов? Это указывает либо на общее эволюционное происхождение транспозаз и ретровирусных интеграз от некоего древнего фермента, работавшего с ДНК (что помещает их в одно большое надсемейство полинуклеотидилтрансфераз), либо на конвергентную эволюцию – независимое возникновение схожего удачного решения для катализа реакций с ДНК. Как один каталитический центр делает и разрыв, и соединение? Обычно один и тот же DDE/DDD-центр катализирует обе реакции, являющиеся по сути вариантами трансэтерификации (переноса фосфодиэфирной связи). Используя ионы металлов, он активирует либо молекулу воды для гидролиза (разрезания), либо 3'-OH группу конца ДНК транспозона для атаки на ДНК-мишень (присоединения). Конкретная реакция зависит от доступных субстратов и конформации фермента на разных стадиях процесса.

Активность транспозазы в клетке, как правило, строго регулируется. Это необходимо для предотвращения чрезмерной мобилизации транспозонов. Как именно? Механизмы разнообразны. Например, клетка может подавлять транскрипцию гена транспозазы с помощью эпигенетических меток (метилирование ДНК, модификации гистонов). В эукариотических клетках специальные малые РНК (siRNA или piRNA) могут узнавать и разрушать мРНК транспозазы, не давая синтезироваться белку. Иногда существуют и белки-ингибиторы, блокирующие активность готового фермента, или же сама транспозаза ингибируется при избыточной концентрации.

Важно помнить, что транспозазы разных суперсемейств ДНК-транспозонов отличаются по своей аминокислотной последовательности, структуре и деталям механизма действия. Именно эти различия лежат в основе классификации ДНК-транспозонов на суперсемейства. Но несмотря на разнообразие, общая логика их работы – узнавание TIRs, вырезание и встраивание ДНК – остается схожей.

3.2.2. Механизм "вырезать-вставить" (Cut-and-paste)

Как мы установили, наиболее распространенный и хорошо изученный механизм перемещения ДНК-транспозонов (Класс II) – это консервативная транспозиция по типу "вырезать-вставить" (cut-and-paste). Давайте рассмотрим его этапы более подробно, помня, что детали могут немного варьировать у разных суперсемейств транспозонов.

Сборка синаптического комплекса (синапсис): Процесс начинается со связывания молекул транспозазы с концевыми инвертированными повторами (TIRs) на обоих концах ДНК-транспозона. Обычно несколько молекул транспозазы взаимодействуют друг с другом (олигомеризуются), физически сближая концы транспозона и формируя стабильную структуру – синаптический комплекс, или транспосому. Зачем нужна эта сложная сборка? Она обеспечивает скоординированное действие транспозазы на оба конца элемента одновременно, предотвращая потерю одного из концов или встраивание неполного транспозона, и повышает общую эффективность и точность всего процесса перемещения.
Вырезание (эксцизия) транспозона: Активированный каталитический домен транспозазы (или домены в комплексе) вносит двуцепочечные разрывы в ДНК точно по границам между TIRs и фланкирующей ДНК хозяина. Это приводит к полному вырезанию (эксцизии) элемента из его исходного (донорного) локуса. На месте бывшего нахождения транспозона остается двуцепочечный разрыв (DSB). У некоторых семейств транспозонов (например, Tc1/mariner) вырезание может происходить через образование промежуточных шпилечных структур. При этом транспозаза сначала делает одноцепочечный разрез, а затем свободный конец ДНК атакует противоположную цепь того же конца, формируя шпильку и одновременно отделяя транспозон. Эта шпилька затем разрезается перед интеграцией.
Захват ДНК-мишени: Транспосома (комплекс ДНК транспозона с белками транспозазы), освободившись от донорного сайта, взаимодействует с новым участком геномной ДНК – сайтом-мишенью.
Атака на мишень и перенос цепей (интеграция): Транспозаза производит разрезы в ДНК-мишени. Важно, что эти разрезы обычно ступенчатые (смещенные), то есть разрывы на двух цепях ДНК происходят не точно друг напротив друга, а со сдвигом в несколько нуклеотидов. Затем транспозаза катализирует реакцию переноса цепей: 3'-OH концы вырезанного транспозона ковалентно присоединяются к 5'-фосфатным группам, образовавшимся в местах разрывов ДНК-мишени.
Репарация и образование TSD: После интеграции на сайте-мишени остаются одноцепочечные бреши (из-за ступенчатых разрывов), а на донорском сайте – двуцепочечный разрыв. Оба этих повреждения исправляются клеточными системами репарации ДНК:

На сайте-мишени: Одноцепочечные бреши заполняются ДНК-полимеразами клетки, используя выступающие концы хозяйской ДНК как матрицу. После лигирования (сшивания) это приводит к тому, что короткий участок ДНК хозяина, изначально находившийся между ступенчатыми разрывами, оказывается дуплицированным. Так образуются прямые повторы сайта-мишени (TSDs), фланкирующие встроившийся транспозон. Длина TSD (например, 2 п.н. для Tc1/mariner, 8 п.н. для hAT) является характерной чертой для каждого семейства транспозонов и точно отражает расстояние между ступенчатыми разрывами, которые вносит их специфическая транспозаза в ДНК-мишень.
На донорском сайте: Двуцепочечный разрыв репарируется. Что чаще происходит: точная починка или с ошибками? Точная репарация (HDR) требует матрицы и активна не всегда, поэтому клетка часто использует быстрый, но неточный механизм NHEJ, который "склеивает" концы как есть, внося инсерции или делеции (инделы). Эти мутации остаются как "шрам" от транспозона. Возможна и абортивная транспозиция: элемент вырезается, но деградирует до интеграции. В этом случае на донорском сайте все равно остается разрыв, который чинится (обычно с ошибкой), а сам транспозон теряется [28].

В результате всего процесса ДНК-транспозон переместился из одного локуса в другой, оставив на старом месте потенциальный "шрам" и создав на новом месте характерные TSD по краям. Поскольку сам элемент переместился, а не скопировался, этот механизм является консервативным по отношению к числу копий транспозона.

3.2.3. Репликативная транспозиция ДНК-элементов (включая Helitrons/rolling circle)

Хотя механизм "вырезать-вставить" является наиболее типичным для ДНК-транспозонов, это не единственный способ их перемещения. Некоторые представители Класса II используют репликативные механизмы, при которых в геноме появляется новая копия элемента, а старая остается на своем месте. Важно подчеркнуть, что, в отличие от ретротранспозонов, этот процесс копирования происходит без участия РНК-интермедиата и обратной транскриптазы, используя ДНК как матрицу.

Один из классических механизмов репликативной ДНК-транспозиции (характерный, например, для бактериального транспозона Tn3) включает образование промежуточной структуры – коинтеграта:

Транспозаза вносит одноцепочечные разрывы на концах транспозона и ступенчатые разрывы в ДНК-мишени.
Концы транспозона соединяются с концами разорванной ДНК-мишени, образуя структуру, где донорная и таргетная молекулы ДНК оказываются слиты через мостики, образованные цепями транспозона.
Клеточная система репликации ДНК узнает эту структуру и реплицирует последовательность транспозона. В результате образуется коинтеграт – единая большая молекула ДНК, содержащая две копии транспозона, фланкирующие место слияния исходной донорной и таргетной молекул.
Затем специальный фермент – резольваза (часто кодируемая самим транспозоном), узнает специфический сайт (res) внутри транспозона и катализирует сайт-специфическую рекомбинацию между двумя копиями транспозона в коинтеграте.
Эта рекомбинация разрешает коинтеграт на две исходные молекулы (донорную и таргетную), каждая из которых теперь несет по одной копии транспозона [41]. Зачем такая сложность с коинтегратом? Возможно, этот механизм позволяет надежно связать репликацию самого транспозона с процессом соединения донорной и таргетной ДНК, используя клеточную репликативную машину, а последующее точное "разрезание" коинтеграта сайт-специфической резольвазой гарантирует правильное разделение итоговых молекул.

Совершенно иной, но тоже репликативный механизм используют Helitrons – уникальная группа ДНК-транспозонов, лишенная TIR и не кодирующая типичную транспозазу. Их перемещение основано на механизме репликации по типу "катящегося кольца", который запускается и управляется белком-инициатором (Rep/Hel), обладающим активностями ДНК-связывания, хеликазы (расплетание ДНК) и нуклеазы-лигазы (разрезание и сшивание одной цепи ДНК). Откуда взялся такой уникальный фермент? Он не похож на классические DDE/DDD-транспозазы, но имеет домены, родственные клеточным и вирусным белкам, участвующим в репликации по типу "катящегося кольца" (например, ДНК-хеликазам семейства Pif1 и репликационным инициаторам Rep). Вероятно, Helitrons возникли путем "сборки" этих доменов в новый многофункциональный белок.

Упрощенно механизм "катящегося кольца" выглядит так:

Белок-инициатор узнает и разрезает одну цепь ДНК на 5'-конце Helitron'а, оставаясь ковалентно связанным с этим концом.
Хеликазная активность раскручивает ДНК элемента, вытесняя разрезанную цепь.
Свободный 3'-OH конец на донорной молекуле, вероятно, служит затравкой для клеточной ДНК-полимеразы, которая синтезирует новую комплементарную цепь на месте вытесненной (восстанавливая исходную копию).
Белок-инициатор, несущий вытесненную одноцепочечную ДНК Helitron'а, находит сайт-мишень, вносит там разрыв и присоединяет к нему 5'-конец Helitron'а.
Затем происходит синтез второй цепи Helitron'а на новом месте (возможно, с участием клеточных полимераз) и узнавание терминального сигнала на 3'-конце Helitron'а белком-инициатором, который завершает процесс переноса и лигирования [42].

Иногда репликация "проскакивает" терминальный сигнал, захватывая и копируя при этом соседние участки хозяйской ДНК (гены или их фрагменты). А что происходит с исходным геном? Так как механизм, вероятно, включает репликацию вытесненной цепи ДНК и восстановление исходной двуцепочечной структуры на донорном сайте, сам ген-донор обычно не разрушается. Захваченный же фрагмент, попадая на новое место, может со временем приобрести новую функцию, встроиться в другой ген или просто стать нефункциональным псевдогеном, но он служит источником генетической новизны. Наконец, хозяйские системы репарации достраивают комплементарную цепь ДНК на новом месте.

В результате Helitron копируется в новое место, часто захватывая с собой фрагменты генов, при этом исходная копия также сохраняется (или восстанавливается). Этот механизм не создает типичных TSDs.

Таким образом, даже в пределах Класса II существует значительное разнообразие механизмов транспозиции, включая как консервативные ("вырезать-вставить"), так и различные репликативные стратегии ("коинтеграт-резолюция", "катящееся кольцо"). Почему сохранилось такое разнообразие? Разные репликативные механизмы, вероятно, возникли независимо и имеют свои преимущества. "Коинтеграт/резольваза" может обеспечивать высокую точность копирования. "Катящееся кольцо" Helitron'ов способствует захвату генов, ускоряя эволюцию хозяина. Разные стратегии оказались успешны в разных эволюционных нишах, дополняя консервативный механизм "вырезать-вставить". Все они основаны на прямых манипуляциях с ДНК.

3.3. Интеграция в геном: образование повторов сайта-мишени (TSDs)

Мы рассмотрели основные механизмы перемещения для Класса I (ретротранспозоны) и Класса II (ДНК-транспозоны). Несмотря на различия в деталях, у большинства этих процессов есть одно общее и очень характерное последствие – образование повторов сайта-мишени (TSDs – Target Site Duplications).

Что такое TSDs? Это короткие последовательности хозяйской ДНК, которые располагаются в прямой ориентации непосредственно по обеим сторонам от встроившегося элемента. Они являются своеобразным "молекулярным шрамом", остающимся после акта интеграции большинства транспозонов.

Как же они образуются? Механизм их формирования является прямым следствием способа, которым ферменты интеграции (интеграза LTR-элементов, эндонуклеаза ORF2 у LINEs, транспозаза ДНК-элементов) взаимодействуют с ДНК-мишенью:

Ступенчатые (смещенные) разрывы: Фермент, ответственный за интеграцию, вносит разрывы не точно друг напротив друга в двух цепях ДНК-мишени, а со смещением в несколько нуклеотидов. Почему именно так? Ступенчатые разрезы создают короткие одноцепочечные "хвосты" на ДНК-мишени, к которым удобно присоединять концы транспозона в ходе реакции переноса цепи – это особенность химического механизма, используемого интегразами и транспозазами.
Интеграция транспозона: Концы ДНК транспозона присоединяются к разорванным концам ДНК-мишени.
Образование одноцепочечных брешей: Из-за ступенчатого характера первоначальных разрывов после присоединения транспозона по обеим сторонам от него образуются короткие одноцепочечные участки ДНК хозяина.
Репарация брешей: Клеточная система репарации ДНК узнает эти одноцепочечные бреши. ДНК-полимераза клетки достраивает комплементарную цепь в каждой бреши, используя выступающую одноцепочечную ДНК хозяина как матрицу. Затем ДНК-лигаза сшивает оставшиеся разрывы.
Результат – дупликация: В результате этого процесса репарации последовательность ДНК хозяина, которая изначально находилась между точками ступенчатых разрывов, оказывается скопированной (дуплицированной). В итоге, встроившийся транспозон оказывается фланкирован двумя абсолютно идентичными копиями короткого участка ДНК сайта-мишени, идущими в одном направлении (прямые повторы) – это и есть TSDs [43].

Нужны ли они для чего-то? Как правило, сами по себе TSDs не несут функции для транспозона или клетки; они являются лишь "побочным продуктом" механизма интеграции. Однако, будучи прямыми повторами, теоретически они могут способствовать редким событиям геномной нестабильности (например, делециям элемента). Важно не путать TSDs с TIRs: TSD – это повторы хозяйской ДНК снаружи элемента, а TIRs – это инвертированные повторы самого транспозона на его концах. Именно TIRs (а не TSDs) распознаются транспозазой для вырезания элемента.

Длина TSD является характерной чертой для многих семейств и суперсемейств транспозонов и определяется специфичностью фермента интеграции – тем, на каком расстоянии друг от друга он вносит ступенчатые разрывы в ДНК-мишень (например, 5 п.н. для Ty3/gypsy, 8 п.н. для hAT, 2 п.н. для Tc1/mariner). Длина TSD может служить важным диагностическим признаком при поиске и классификации транспозонов в геноме.

Стоит отметить, что не все мобильные элементы создают TSDs. Например, Helitrons, использующие механизм "катящегося кольца", обычно встраиваются без образования таких повторов. Почему? Это подтверждает, что их механизм интеграции, основанный на "катящемся кольце" и действии белка-инициатора, принципиально отличается и не включает создание ступенчатых двуцепочечных разрывов в ДНК-мишени, характерных для классической транспозиции. Однако для подавляющего большинства "классических" ретротранспозонов и ДНК-транспозонов наличие TSDs по краям является надежным свидетельством их интеграции в геном.

3.4. Выбор сайта вставки: случайность или специфичность? ("Безопасные гавани")

После того как транспозон (или его ДНК-копия) готов к интеграции, возникает ключевой вопрос: куда именно в геноме он встроится? Будет ли это совершенно случайное событие, или существуют какие-то правила и предпочтения? Ответ, как это часто бывает в биологии, лежит где-то посередине: интеграция транспозонов не является ни абсолютно случайной, ни строго специфичной для большинства элементов, но подвержена влиянию множества факторов.

Степень специфичности выбора сайта-мишени сильно варьирует у разных транспозонов:

Некоторые могут встраиваться в огромное количество сайтов, демонстрируя лишь слабую предпочтительность к определенным коротким последовательностям ДНК (например, динуклеотид TA для семейства mariner, AT-богатые участки для LINE-1).
На выбор места могут влиять локальные структурные особенности ДНК.
В геномах эукариот огромную роль играет состояние хроматина:

Открытый эухроматин, где гены активно транскрибируются, часто является более доступной мишенью для многих транспозонов.
Плотный гетерохроматин, обычно бедный генами, также может привлекать определенные семейства.

Интеграционные комплексы могут взаимодействовать с определенными белками хозяина, связанными с хроматином, направляя интеграцию в определенные регионы генома (как в примере с ВИЧ и LEDGF/p75). Куда же в итоге чаще всего попадают транспозоны, учитывая эти факторы и отбор? Это зависит от конкретного элемента и хозяина. Например, у человека многие активные LINE-1 и Alu чаще обнаруживаются в ген-бедных районах или интронах, что может отражать как исходные биохимические предпочтения, так и отбор против вставок в важные кодирующие участки [44]. Другие же элементы могут активно таргетироваться в генные области.

Эти биохимические предпочтения и структурные ограничения дополняются действием эволюционного отбора. Очевидно, что вставки транспозонов в жизненно важные гены или критические регуляторные элементы часто будут вредны или летальны для организма-хозяина. Такие события будут элиминироваться отбором. Напротив, вставки в участки генома, где они не вызывают серьезных последствий, с большей вероятностью сохранятся и передадутся потомству.

Это приводит нас к концепции "безопасных гаваней" (safe havens) для транспозонов. "Безопасные гавани" – это такие регионы генома, интеграция в которые минимально сказывается на жизнеспособности хозяина. Типичными примерами служат:

Обширные гетерохроматиновые районы.
Длинные межгенные спейсеры.
Интроны некоторых генов.
Тела других мобильных элементов, особенно неактивных копий. Почему это безопасно? Учитывая, что значительная часть генома состоит из древних, "мертвых" транспозонов, вставка в такой элемент с гораздо меньшей вероятностью нарушит жизненно важную функцию клетки, чем вставка в уникальный ген. Это делает их обширной и относительно безопасной мишенью.

Можно предположить, что в ходе коэволюции с хозяином некоторые транспозоны могли выработать механизмы, повышающие вероятность их встраивания именно в такие "безопасные гавани". Могут ли транспозоны "научиться" лучшей специфичности? Да, в ходе коэволюции отбор может благоприятствовать тем вариантам транспозонов, чьи ферменты интеграции (или связанные белки) развивают более выраженное "предпочтение" к безопасным участкам генома, так как это повышает шансы на долгосрочное выживание и транспозона, и его хозяина. С другой стороны, геном хозяина также мог выработать механизмы, эффективнее подавляющие активность транспозонов именно в функционально важных областях.

Тем не менее, если существуют "безопасные гавани" и отбор, почему транспозоны все еще вызывают болезни? Во-первых, интеграция все равно несет элемент случайности, и "неудачные" вставки иногда происходят. Во-вторых, отбор действует на популяцию в целом и на протяжении поколений, а новая вредная вставка может возникнуть у конкретного индивида (в зародышевых или соматических клетках) и вызвать заболевание до того, как отбор успеет ее элиминировать. К тому же, некоторые вставки могут быть лишь слабо вредными, а при высокой активности транспозонов число новых мутаций может временно "перегрузить" систему отбора.

Таким образом, наблюдаемое распределение транспозонов в геноме – это результат сложного взаимодействия между внутренними свойствами самого транспозона (специфичность его ферментов), глобальной и локальной структурой генома хозяина (доступность хроматина, последовательности ДНК) и давлением естественного отбора, благоприятствующего менее "опасным" вставкам.

Главой 4: Транспозоны и архитектура генома: мутации, перестройки и размер

4.1. Транспозоны как источники мутаций

Мы подробно рассмотрели механизмы, с помощью которых транспозоны перемещаются по геному. Теперь давайте сосредоточимся на последствиях этой мобильности. Одно из самых прямых и очевидных следствий активности транспозонов – это их способность вызывать мутации. Сам акт встраивания последовательности ДНК в новое место неизбежно изменяет исходную последовательность в этом локусе, что может иметь разнообразные последствия для функции генов и генома в целом. Транспозоны являются мощными эндогенными мутагенами, то есть источниками мутаций, возникающими изнутри самого генома.

Тип и сила мутагенного эффекта сильно зависят от того, куда именно встроился транспозон [18]:

Вставка в кодирующую область гена (экзон): Если транспозон встраивается непосредственно в участок гена, который кодирует аминокислотную последовательность белка (экзон), это почти всегда приводит к катастрофическим последствиям для функции этого белка. Почему именно в экзоне? Потому что экзоны несут точную инструкцию для синтеза белка, читаемую группами по три нуклеотида (кодонами). Вставка в экзон (если ее длина не кратна трем) сбивает эту рамку считывания генетического кода. Как это работает? Представьте, что генетический код – это предложение, где слова состоят ровно из трех букв: КОТ ЕСТ СУП. Если мы вставим четыре случайные буквы (XXXX) после первого слова, получится КОТ XXXX Е СТС УП... – смысл полностью теряется, так как группировка по три буквы сбита. Точно так же вставка транспозона в экзон сбивает правильную группировку нуклеотидов в кодоны, что приводит к синтезу совершенно другой, обычно нефункциональной, аминокислотной последовательности после места вставки, и часто к преждевременному появлению стоп-кодона. В результате клетка производит либо укороченный, либо полностью нефункциональный белок. Такая мутация обычно приводит к потере функции гена (loss-of-function) [45].
Вставка в регуляторную область гена: Транспозоны могут встраиваться не в сам ген, а в участки ДНК рядом с ним, которые контролируют его активность – промоторы, энхансеры, сайленсеры. Последствия такой вставки могут быть разнообразными: экспрессия гена может усилиться или ослабнуть, может измениться паттерн экспрессии. От чего зависит эффект? И от места вставки (например, разрушение сайта связывания фактора транскрипции может снизить экспрессию), и от самого транспозона. Многие транспозоны несут свои собственные встроенные регуляторные сигналы (промоторы, энхансеры), изначально нужные для их собственной активности. Встроившись рядом с геном, эти "мобильные регуляторы" могут начать влиять на его работу, например, усиливая экспрессию за счет своего энхансера или запуская ее в неподходящее время со своего промотора.
Вставка в интрон: Интроны – это некодирующие участки гена, которые вырезаются из РНК в процессе сплайсинга. На первый взгляд, вставка транспозона в интрон может показаться относительно безопасной. Почему? Интроны вырезаются из РНК до синтеза белка и не содержат кодонов, поэтому вставка напрямую не меняет аминокислотную последовательность. Однако, это не значит, что такие вставки безвредны, так как они могут нарушить сам процесс вырезания интронов (сплайсинг). Об этом мы подробнее поговорим в следующем подразделе.

Таким образом, сам факт интеграции транспозона в новую точку генома является мутагенным событием. Эти инсерционные мутации – основной механизм, посредством которого транспозоны напрямую влияют на фенотип организма, создавая генетическое разнообразие, но зачастую приводя к негативным последствиям для приспособленности.

4.1.1. Инсерционный мутагенез: нарушение генов и регуляторных элементов

Как мы увидели в предыдущем разделе, встраивание транспозона – это всегда изменение последовательности ДНК в месте вставки. Теперь давайте подробнее рассмотрим, к каким функциональным последствиям для генов приводят такие инсерционные мутации, в зависимости от точной локализации вставки.

Прямое нарушение функции гена (мутации потери функции) Наиболее очевидный результат – это полная или частичная потеря функции гена. Чаще всего это происходит при вставке транспозона в экзон. Как мы обсуждали, это почти всегда вызывает сдвиг рамки считывания и/или появление преждевременных стоп-кодонов. В результате клетка производит либо укороченный, либо полностью нефункциональный белок. Насколько полной будет потеря функции? Это зависит от места вставки и ее последствий для рамки считывания. Вставка в начале гена, вызывающая сдвиг рамки, почти всегда дает нуль-аллель (полная потеря функции). Вставка ближе к концу гена или вставка, не сдвигающая рамку (если длина TE кратна трем и нет стоп-кодонов), может привести к гипоморфному аллелю с частичной функцией. Инсерционный мутагенез в экзонах является частой причиной спонтанных мутаций. Потеря функции гена может произойти и при вставке в критически важную регуляторную область, например, в самое "сердце" промотора или в ключевой энхансер, без которого ген просто не может нормально экспрессироваться [46]. У прокариот вставка транспозона в один из первых генов оперона может блокировать транскрипцию последующих генов (полярный эффект).
Изменение экспрессии гена (регуляторные мутации) Вставки в регуляторные области не всегда приводят к потере функции. Иногда они вызывают более сложные изменения в работе гена:

Повышение уровня экспрессии (гиперморфные аллели): Если транспозон несет сильный энхансер или промотор и встраивается рядом с геном, он может заставить этот ген работать активнее.
Эктопическая экспрессия: Транспозонные регуляторные элементы могут активировать ген в тех тканях или на тех стадиях развития, где он обычно "молчит". Хорошо это или плохо? Зачастую это вредно, так как нарушает нормальные процессы. Но иногда такая "ошибка" может случайно оказаться полезной, например, если активация гена в новом месте дает доступ к новому ресурсу или создает основу для новой функции. Так эктопическая экспрессия, вызванная транспозонами, может стать источником эволюционных новшеств.
Изменение регуляторного ответа: Транспозон может привнести элементы, делающие соседний ген чувствительным к новым сигналам (например, к стрессу).
Изоляция гена: Некоторые транспозоны содержат последовательности-инсуляторы, блокирующие взаимодействие гена с его нормальными регуляторами.
Изменение структуры регуляторного элемента: Вставка может изменить структуру промотора/энхансера, приводя к тонким изменениям экспрессии. От чего зависит конкретный эффект? И от места вставки, и от самого транспозона. Многие транспозоны несут свои собственные встроенные регуляторные сигналы. Встроившись рядом с геном, эти "мобильные регуляторы" могут начать влиять на его работу [47]. При этом часто имеет значение и ориентация, в которой встроился транспозон. Например, промотор внутри транспозона сможет запустить транскрипцию соседнего гена, только если он "смотрит" в нужную сторону.

Таким образом, инсерционный мутагенез, вызванный транспозонами, – это мощный генератор аллельного разнообразия. Что же происходит чаще – "поломка" гена или его "перенастройка"? Действительно, случайные вставки гораздо чаще приводят к потере функции, чем к полезным изменениям экспрессии или функции. Однако даже редкие случаи "удачных" регуляторных мутаций могут играть важную роль в эволюции, если они дают организму преимущество. Транспозоны могут не только "ломать" гены, но и тонко перенастраивать их работу, создавая новые варианты экспрессии, которые могут стать материалом для эволюционного отбора.

4.1.2. Влияние на сплайсинг

Мы установили, что вставки транспозонов в экзоны или регуляторные области генов могут напрямую нарушать их функцию или изменять экспрессию. Однако даже интеграция в интроны – участки гена, которые вырезаются из РНК-предшественника в процессе созревания мРНК – далеко не всегда проходит бесследно. Транспозоны, попавшие в интроны, могут существенно влиять на процесс сплайсинга.

Напомним, что сплайсинг – это процесс удаления интронов из пре-мРНК и точного соединения оставшихся экзонов для формирования зрелой мРНК. Этот процесс требует высочайшей точности и осуществляется сплайсосомой, которая распознает специфические сигнальные последовательности на границах экзон/интрон и внутри интрона.

Как вставка транспозона в интрон может нарушить этот механизм?

Создание криптических сайтов сплайсинга: Последовательность самого транспозона может случайно содержать участки, похожие на настоящие сайты сплайсинга. Откуда они там берутся? Обычно это случайное совпадение: короткие сигнальные последовательности сайтов сплайсинга могут возникнуть в любой достаточно длинной ДНК в результате мутаций. Самим транспозонам эти сайты, как правило, не нужны. Сплайсосома может ошибочно распознать такой "криптический" сайт и использовать его вместо настоящего. Это может привести к:

Включению части или всей последовательности транспозона в зрелую мРНК (экзонизация транспозона) [49]. Может ли это быть полезно? Хотя чаще всего это нарушает функцию белка, в редких случаях включение нового небольшого "блока", происходящего от транспозона, может случайно придать белку новое полезное свойство. Таким образом, экзонизация транспозонов рассматривается как один из путей эволюционного возникновения новых белковых функций (подробнее в Главе 6).
Неправильному вырезанию части интрона или даже соседнего экзона.

Нарушение канонических сайтов сплайсинга: Если транспозон встраивается очень близко к границе экзон/интрон, он может физически разрушить или замаскировать настоящий сайт сплайсинга. Это может привести к пропуску экзона (exon skipping) или сохранению интрона (intron retention) в зрелой мРНК. Что из этого хуже? Оба события обычно вредны. Интрон почти всегда содержит стоп-кодоны во всех рамках считывания, поэтому его сохранение приводит к укороченному белку. Пропуск экзона означает потерю целого домена белка. И то, и другое часто ведет к полной потере функции.
Изменение регуляции сплайсинга: Внутри интронов часто находятся короткие последовательности (энхансеры или сайленсеры сплайсинга), с которыми связываются регуляторные белки. Вставка транспозона может разрушить такие элементы или привнести свои собственные, что изменит паттерн сплайсинга.
Преждевременная терминация и полиаденилирование: Некоторые транспозоны несут в своей последовательности сигналы полиаденилирования. Если такой сигнал оказывается в интроне, он может привести к преждевременному обрыву транскрипта и образованию укороченной мРНК [48].

Любое из этих нарушений сплайсинга, как правило, приводит к образованию аберрантной мРНК, которая либо не может быть нормально транслирована, либо дает начало нефункциональному или укороченному белку. Однако клетка не беззащитна: существуют механизмы контроля качества мРНК, такие как нонсенс-опосредованный распад (NMD). Эти системы распознают мРНК с преждевременными стоп-кодонами (частый результат ошибок сплайсинга) и уничтожают их до начала синтеза белка, тем самым снижая вред от мутаций, вызванных транспозонами. Тем не менее, влияние транспозонов на сплайсинг является еще одним важным механизмом их мутагенного действия, способным вызывать потерю функции гена даже при вставке в некодирующую область интрона.

4.2. Крупномасштабные перестройки генома, индуцированные транспозонами

Помимо мутаций, возникающих непосредственно в результате встраивания транспозона в новое место, наличие множественных копий мобильных элементов, разбросанных по всему геному, создает предпосылки для еще одного типа генетических изменений – крупномасштабных перестроек генома. Эти перестройки затрагивают целые сегменты хромосом и могут приводить к значительным изменениям в структуре и организации генома.

Основной механизм, лежащий в основе таких перестроек, – это гомологичная рекомбинация (или, точнее, неаллельная гомологичная рекомбинация, NAHR – Non-Allelic Homologous Recombination). Клеточная система рекомбинации предназначена для обмена участками между гомологичными последовательностями ДНК. Однако система рекомбинации может ошибочно "спарить" две копии транспозона, расположенные в разных местах генома. Почему происходит эта "ошибка"? Клеточная рекомбинационная машина ищет протяженные участки с высокой степенью сходства ДНК. Недавно возникшие копии транспозонов одного семейства как раз являются такими участками, часто имея идентичность более 95-99% на протяжении тысяч нуклеотидов, что "обманывает" систему, заставляя ее считать их гомологичными, несмотря на разное положение в геноме. Последствия такой ошибочной рекомбинации зависят от взаимного расположения и ориентации взаимодействующих копий транспозонов:

Делеция: Если рекомбинация происходит между двумя копиями транспозона, расположенными на одной хромосоме и ориентированными в одном направлении (прямые повторы), это может привести к образованию петли и вырезанию участка ДНК, находящегося между этими копиями. Как ориентация влияет на результат? При рекомбинации между прямыми повторами на одной хромосоме образуется петля, которая может быть вырезана вместе с заключенным между повторами сегментом ДНК, приводя к делеции.
Дупликация: Неравный кроссинговер между копиями транспозонов на гомологичных хромосомах или сестринских хроматидах может привести к тому, что на одной хромосоме окажется удвоенный (дуплицированный) сегмент ДНК между транспозонами, а на другой – он будет потерян.
Инверсия: Если рекомбинация происходит между двумя копиями транспозона на одной хромосоме, но ориентированными в противоположных направлениях (инвертированные повторы), то рекомбинация между ними приводит к "переворачиванию" сегмента ДНК между повторами относительно остальной хромосомы, вызывая инверсию.
Транслокация: Если рекомбинация происходит между копиями транспозонов, расположенными на разных (негомологичных) хромосомах, это может привести к обмену участками между этими хромосомами – транслокации [50].

Важно подчеркнуть, что сами по себе эти перестройки вызываются не активностью транспозазы или обратной транскриптазы, а работой стандартных клеточных систем рекомбинации и репарации ДНК, которые ошибочно используют множественные копии транспозонов как сайты для своего действия.

Насколько часто случаются такие перестройки? По сравнению с отдельными вставками транспозонов или точечными мутациями, крупные перестройки, вызванные рекомбинацией между ТЭ – события относительно редкие в расчете на одно поколение. Однако из-за огромного числа копий ТЭ в геноме, за длительные эволюционные периоды они происходят достаточно часто, чтобы существенно влиять на структуру геномов.

Последствия крупномасштабных перестроек могут быть очень серьезными: они могут приводить к потере или удвоению целых генов, нарушению их регуляции из-за перемещения в новое окружение, созданию гибридных генов, изменению структуры хромосом. Такие изменения часто лежат в основе генетических заболеваний ("геномных болезней"). Но могут ли они быть полезны? Да, несмотря на частый вред, такие перестройки – важный источник эволюционных инноваций. Дупликации генов создают "запасные копии", которые могут свободно изменяться и приобретать новые функции. Инверсии могут помогать сохранять удачные комбинации генов. Даже транслокации, хотя и часто вызывают проблемы с размножением, могут способствовать видообразованию. Таким образом, транспозоны выступают не только как точечные мутагены, но и как архитекторы, постоянно перекраивающие геном на макроуровне.

4.2.1. Делеции, дупликации, инверсии

Как мы видели, неаллельная гомологичная рекомбинация (NAHR) между копиями транспозонов может приводить к различным типам крупных перестроек внутри одной хромосомы или между гомологичными хромосомами. Рассмотрим основные из них:

Делеции: Потеря участка хромосомы. Возникает чаще всего в результате рекомбинации между двумя копиями транспозона, ориентированными в одном направлении (прямые повторы) на одной и той же хромосоме. При этом участок ДНК между повторами вырезается. Насколько большим может быть удаленный участок? Его размер полностью определяется расстоянием между рекомбинирующими копиями транспозонов и может варьировать от нескольких тысяч до миллионов пар нуклеотидов, затрагивая как отдельные гены, так и большие хромосомные регионы. Главное последствие делеции – потеря генетического материала, что часто приводит к серьезным генетическим заболеваниям.
Дупликации: Удвоение участка хромосомы. Часто возникают из-за неравного кроссинговера между копиями транспозонов на гомологичных хромосомах или сестринских хроматидах. В результате одна хромосома получает дополнительную копию сегмента ДНК. Размер дуплицированного участка также зависит от расстояния между рекомбинирующими транспозонами.
Инверсии: Поворот участка хромосомы на 180 градусов. Происходят в результате рекомбинации между двумя копиями транспозона, ориентированными в противоположных направлениях (инвертированные повторы) на одной хромосоме [50]. Сама по себе инверсия не приводит к потере генетического материала. Почему она тогда может быть вредной или иметь последствия? Во-первых, она может нарушить гены, если точки разрыва пришлись на их кодирующие или регуляторные области. Во-вторых, она может изменить регуляцию генов, переместив их в новое хроматиновое окружение. В-третьих, инверсии сильно подавляют рекомбинацию внутри инвертированного сегмента у гетерозиготных особей (несущих одну нормальную и одну инвертированную хромосому). Это происходит из-за невозможности нормального спаривания и кроссинговера между инвертированным и неинвертированным сегментами в мейозе (образующиеся рекомбинантные хромосомы обычно нежизнеспособны). Такое подавление рекомбинации может быть эволюционно важным для сохранения вместе группы "удачных" генов.

Дупликации увеличивают копийность генов. Это может быть вредным, но и полезным в эволюционном плане. Как именно? "Лишняя" копия гена освобождается от сильного очищающего отбора и может свободно накапливать мутации. Со временем некоторые из этих мутаций могут случайно привести к появлению новой полезной роли для гена (неофункционализация) или к разделению функций между копиями (субфункционализация) [51].

Эти три типа перестроек – делеции, дупликации и инверсии – являются важными механизмами изменения структуры хромосом. Какой тип перестроек встречается чаще? Трудно дать однозначный ответ, так как это зависит от генома и типа транспозонов. Возможно, небольшие делеции/дупликации возникают чаще, чем крупные инверсии, так как близко расположенные повторы могут рекомбинировать с большей вероятностью, а крупные перестройки чаще оказываются вредными и элиминируются отбором. Рассеянные по геному копии транспозонов служат удобными "точками опоры" для возникновения всех этих перестроек.

4.2.2. Транслокации

Помимо перестроек внутри одной хромосомы или между гомологичными хромосомами, неаллельная гомологичная рекомбинация (NAHR) между копиями транспозонов может приводить и к обмену участками между негомологичными хромосомами. Такие события называются транслокациями [50]. Они случаются, вероятно, реже, чем внутрихромосомные перестройки, так как требуют сближения и рекомбинации между участками, расположенными на разных хромосомах, что статистически менее вероятно.

Механизм их возникновения схож с другими NAHR-опосредованными перестройками: клеточная система рекомбинации ошибочно спаривает высокоидентичные копии транспозонов, расположенные на разных хромосомах. Последующий обмен участками (кроссинговер) между этими неправильно спаренными транспозонами приводит к "перекрестному" обмену сегментами между исходными негомологичными хромосомами. Чаще всего это приводит к реципрокной транслокации, при которой две разные хромосомы обмениваются своими фрагментами. В результате образуются две новые, перестроенные хромосомы.

Каковы последствия транслокаций?

Нарушение генов и образование гибридных генов: Точки разрыва хромосом при транслокации могут приходиться на гены, разрушая их или приводя к слиянию частей двух разных генов. Такие гибридные гены могут быть нефункциональны, но иногда приобретают новую, часто патологическую активность. Как это может вызвать рак? Если, к примеру, часть гена, отвечающего за клеточный рост, сливается с частью постоянно активного гена, может образоваться гибридный белок, бесконтрольно стимулирующий деление клеток. Классический пример – BCR-ABL при хроническом миелолейкозе, возникающий из-за транслокации между хромосомами 9 и 22 (хотя он не всегда вызван ТЭ, но иллюстрирует принцип).
Изменение генной регуляции: Гены, оказавшиеся рядом с точкой разрыва, могут попасть под влияние новых регуляторных элементов или в иное хроматиновое окружение.
Проблемы в мейозе и снижение фертильности: Наиболее характерное последствие реципрокных транслокаций проявляется при образовании половых клеток (мейозе) у гетерозигот (организмов, несущих одну пару нормальных хромосом и одну пару транслоцированных). Что значит "сбалансированная" транслокация у носителя? Обычно это означает, что у самого носителя весь генетический материал присутствует в правильном количестве, просто "перетасован" между хромосомами, и он фенотипически здоров. Проблемы возникают именно при мейозе из-за неправильного расхождения аномально спарившихся хромосом (образующих сложную структуру - квадривалент), что ведет к генетически несбалансированным гаметам (с нехваткой одних участков и избытком других). Оплодотворение такими гаметами обычно приводит к гибели эмбриона или рождению потомства с генетическими нарушениями. В результате у носителей сбалансированных транслокаций часто наблюдается сниженная фертильность [52].
Роль в видообразовании: Снижение фертильности у гибридов между особями с нормальным кариотипом и носителями транслокации является эффективным механизмом репродуктивной изоляции. Но как это помогает видообразованию, если фертильность снижена? Именно эта пониженная фертильность гибридов предотвращает смешение генов между популяцией с исходным набором хромосом и популяцией, где транслокация стала распространенной. Возникший барьер позволяет двум группам накапливать генетические различия независимо друг от друга, что со временем и может привести к формированию новых видов [53].

Таким образом, транслокации, возникающие в результате рекомбинации между рассеянными копиями транспозонов, представляют собой еще один тип крупномасштабных геномных перестроек с важными последствиями для функционирования генов, репродукции и эволюции видов.

4.3. Влияние транспозонов на экспрессию генов

Мы уже обсудили, как вставки транспозонов могут напрямую нарушать кодирующие последовательности генов или грубо "ломать" их регуляторные области, приводя к потере функции. Однако влияние мобильных элементов на работу генов гораздо многообразнее и тоньше. Транспозоны могут не просто включать или выключать гены, но и изменять уровень, время и место их экспрессии, вплетая их в новые регуляторные каскады. Это происходит благодаря тому, что сами транспозоны несут в себе разнообразные регуляторные последовательности или влияют на регуляторное окружение гена.

Рассмотрим основные механизмы такого влияния:

Предоставление регуляторных элементов: Многие автономные транспозоны имеют собственные промоторы, энхансеры, сайленсеры или инсуляторы. Если такой элемент встраивается перед геном хозяина или в его интрон, его регуляторные элементы могут начать управлять транскрипцией этого гена или модулировать ее [47]. Например, сильный энхансер внутри транспозона может усилить экспрессию соседнего гена, а промотор — запустить его транскрипцию в новых условиях или тканях. Некоторые ТЭ также несут сигналы полиаденилирования, которые могут привести к образованию укороченных транскриптов.
Распространение сайтов связывания факторов транскрипции (TFBS): Последовательности транспозонов часто содержат мотивы, которые могут служить сайтами связывания для клеточных факторов транскрипции. Размножаясь и рассеиваясь по геному, транспозоны таким образом распространяют эти потенциальные TFBS. Со временем, в результате мутаций и под действием отбора, некоторые из этих сайтов могут стать функционально активными, попадая под контроль соответствующего фактора транскрипции и вовлекая соседний ген хозяина в новую регуляторную сеть [54]. Это считается одним из ключевых механизмов быстрой эволюции генных сетей.
Изменение структуры хроматина: Сама вставка транспозона может изменить локальную укладку хроматина, сделав соседние гены более или менее доступными для транскрипции. Кроме того, как мы знаем, транспозоны часто являются мишенью для эпигенетического сайленсинга (метилирование ДНК, модификации гистонов). Формирование плотного гетерохроматина на транспозоне может иногда распространяться ("перекидываться") на соседние участки генома, подавляя экспрессию расположенных там генов хозяина [21].
Генерация регуляторных некодирующих РНК: Транскрипты, считываемые с последовательностей транспозонов, могут служить предшественниками для различных классов функциональных некодирующих РНК (нкРНК), таких как длинные некодирующие РНК (lncRNA) или малые интерферирующие РНК (siRNA, piRNA). Эти нкРНК могут участвовать в регуляции экспрессии генов хозяина на уровне транскрипции, пост-транскрипционной регуляции или модификации хроматина [55].

В результате этих разнообразных механизмов вставки транспозонов могут приводить к тонкой настройке, перепрограммированию или полной смене характера экспрессии генов хозяина. Хотя многие такие изменения вредны, некоторые могут оказаться адаптивными. Способность транспозонов быстро "переwiring" (перенастраивать) генные сети считается одним из важнейших механизмов их вклада в эволюционную пластичность и возникновение новых признаков.

4.4. Транспозоны и размер генома: парадокс C-value

Помимо локальных мутаций и крупномасштабных перестроек, транспозоны оказывают огромное влияние на один из самых базовых параметров генома – его общий размер. Если мы сравним количество ДНК в гаплоидном наборе хромосом (этот показатель называют C-value) у разных эукариотических организмов, мы обнаружим поразительные различия, измеряемые порой порядками величины.

Это наблюдение привело к формулировке "парадокса C-value": отсутствует прямая и простая зависимость между размером генома (C-value) и предполагаемой сложностью строения организма или количеством кодирующих генов [13]. Если дело не в размере генома или числе генов, то откуда берется сложность? Современные представления говорят о том, что сложность организма определяется скорее комплексностью генных регуляторных сетей, разнообразием белков, получаемых за счет альтернативного сплайсинга, пост-трансляционными модификациями белков и сложными межклеточными взаимодействиями, а не просто количеством ДНК или генов. В чем же причина таких колоссальных различий в размере геномов, не связанных напрямую с числом генов?

Сегодня мы понимаем, что главным "виновником" этих различий являются мобильные генетические элементы. Именно дифференциальное накопление транспозонов в ходе эволюции разных видов вносит основной вклад в вариации размера их геномов [56]. В геномах с большим C-value, как правило, именно последовательности, произошедшие от транспозонов, составляют львиную долю всей ДНК.

Как транспозоны способствуют росту генома?

Ретротранспозоны (Класс I): Их механизм "копировать-вставить" по своей природе ведет к амплификации.
Репликативные ДНК-транспозоны (Класс II): Некоторые ДНК-транспозоны также используют репликативные механизмы.
Крупномасштабные дупликации: Рекомбинация между копиями ТЭ может приводить к дупликации больших сегментов генома. Но есть ли какая-то польза от такого огромного, "раздутого" ТЭ генома? Чаще всего накопление ТЭ рассматривается как следствие их "эгоистичной" природы – побочный эффект их размножения, который может быть даже вреден (метаболические затраты на репликацию лишней ДНК). Однако предполагается, что большой геном с обилием ТЭ может косвенно давать и некоторые преимущества: служить "буфером", поглощающим мутации, предоставлять больше материала для генетических перестроек и эволюционных инноваций, или даже влиять на размер клетки и ядра. Тем не менее, прямые адаптивные выгоды от самого факта большого размера генома, набранного за счет ТЭ, остаются предметом дискуссий.

Конечно, размер генома – это динамический баланс между процессами, его увеличивающими, и процессами, его уменьшающими. К последним относятся, прежде всего, делеции. Как работает это удаление ДНК? Делеции могут возникать разными путями: например, за счет рекомбинации между прямыми повторами ТЭ (NAHR), или как результат ошибок при репарации двуцепочечных разрывов (NHEJ), или через другие механизмы. Как правило, эти механизмы не нацелены специфично на удаление именно транспозонов, но действуют на повторяющиеся или поврежденные участки ДНК в целом; транспозоны просто являются обильным субстратом для делеций, опосредованных NAHR. Виды с очень компактными геномами (как рыба фугу) характеризуются, вероятно, высокой активностью механизмов делеций или же очень строгим контролем над активностью транспозонов [57].

Примеры крайностей – геном человека (~50% ТЭ) и кукурузы (~85% ТЭ) с одной стороны, и компактные геномы дрожжей (~3% ТЭ) или рыбы фугу с другой – ярко иллюстрируют роль транспозонов в определении размера генома.

Насколько быстро может меняться размер генома? Эволюционные исследования показывают, что изменения могут быть довольно быстрыми. "Вспышки" активности определенных семейств транспозонов (например, после межвидовой гибридизации или стресса) могут привести к сравнительно быстрому увеличению генома в данной эволюционной линии. И наоборот, усиление механизмов делеций или контроля над ТЭ может способствовать его уменьшению. Существуют примеры близкородственных видов с геномами, различающимися по размеру в несколько раз, что говорит о возможности быстрой динамики.

Таким образом, транспозоны являются не просто "пассажирами" или мутагенами, но и основными архитекторами размера генома у эукариот. Их способность к самокопированию и накоплению в геноме дает ключ к разгадке парадокса C-value: большая часть ДНК во многих "раздутых" геномах – это не гены, а следы бурной эволюционной истории мобильных элементов.

5.1. Необходимость контроля: угроза геномной стабильности

В предыдущих главах мы убедились, что транспозоны – это динамичные компоненты генома, способные перемещаться, вызывать мутации, влиять на экспрессию генов и даже приводить к крупномасштабным перестройкам хромосом. Учитывая их "эгоистичную" природу и способность к самокопированию (особенно у ретротранспозонов), возникает закономерный вопрос: что мешает им полностью "захватить" геном и разрушить его упорядоченную структуру?

Очевидно, что неконтролируемая активность мобильных элементов представляет серьезную угрозу для стабильности генома и жизнеспособности организма-хозяина. Эта угроза проявляется на нескольких уровнях:

Мутагенная активность: Каждая новая вставка транспозона – это потенциальная мутация, способная нарушить жизненно важные гены.
Геномная нестабильность: Транспозоны провоцируют крупные хромосомные перестройки, повышая риск разрывов хромосом и потери генетического материала.
Метаболическая нагрузка: Репликация и экспрессия активных транспозонов требуют значительных клеточных ресурсов. Насколько велика эта нагрузка, особенно от неактивных ТЭ? Копирование неактивной ДНК при делении клетки – это общие затраты на репликацию всего генома. Гораздо более существенна нагрузка от активных ТЭ – синтез их РНК и белков, сама транспозиция. Именно подавление этой активности является главной задачей контроля с точки зрения экономии ресурсов.

Становится ясно, что для выживания и успешного размножения организм-хозяин жизненно нуждается в механизмах контроля и подавления активности мобильных генетических элементов [58]. Геном должен уметь отличать "свое" (полезные гены) от "чужого" или, по крайней мере, "опасного" (активные транспозоны) и применять к последним репрессивные меры. Как клетка их узнает? Она использует разные "подсказки": например, распознает необычные РНК (двуцепочечные), характерные для ТЭ; нацеливается на высокоповторяющиеся последовательности для эпигенетического "заглушения"; или использует систему "памяти" на основе малых РНК (piРНК) в зародышевой линии, чтобы узнать и подавить "старых знакомых". Эти механизмы не всегда распознают ТЭ напрямую как "чужой", но реагируют на особенности их структуры или жизненного цикла.

Почему эволюция не привела к полному удалению транспозонов, раз они такие опасные? Полностью "вычистить" геном от интегрированных ТЭ чрезвычайно сложно и опасно для самой клетки (риск повредить нужные гены). Кроме того, ТЭ постоянно эволюционируют, а иногда могут даже становиться полезными (Глава 6). Поэтому эволюция чаще выбирала путь эффективного подавления их активности, а не тотальной элиминации.

И действительно, в ходе длительной коэволюции с мобильными элементами живые организмы выработали сложные и многоуровневые системы защиты, направленные на ограничение транспозиции и минимизацию ее вредных последствий. Но если защита есть, почему ТЭ все равно иногда активны? Эти системы не идеальны. Транспозоны постоянно эволюционируют, пытаясь "ускользнуть" от контроля. Иногда защита может ослабляться (например, при стрессе), или в геном может попасть новый ТЭ, к которому еще нет "иммунитета". Это постоянная "гонка вооружений", где ни одна сторона не одерживает окончательной победы. Эти системы защиты действуют на разных этапах жизненного цикла транспозонов.

В следующих разделах этой главы мы подробно рассмотрим основные стратегии, которые использует геном хозяина для контроля над своими беспокойными "соседями" – транспозонами, включая эпигенетическое молчание и РНК-интерференцию.

5.2. Эпигенетическое подавление (Сайленсинг)

Одним из самых фундаментальных и широко распространенных механизмов защиты генома от мобильных элементов является эпигенетическое подавление, или сайленсинг (от англ. silencing – заглушение). Эпигенетика изучает наследуемые изменения в активности генов, которые не связаны с изменением самой последовательности ДНК. В контексте защиты от транспозонов, эпигенетические механизмы позволяют клетке "пометить" последовательности ТЭ как опасные или нежелательные и поддерживать их в неактивном, "молчащем" состоянии, причем это состояние может передаваться дочерним клеткам при делении [21]. Как же клетка "узнает", что нужно заглушить именно новый транспозон? Начальное распознавание часто связано с особенностями РНК, транскрибируемых с ТЭ (например, образованием двуцепочечных РНК) или с их высокой повторяемостью. Сигналы от этих РНК или структур затем направляют ферменты (ДНК-метилтрансферазы и гистоновые модификаторы) к соответствующему участку ДНК, "запуская" процесс сайленсинга. Ключевую роль в этом, особенно в зародышевой линии, играют малые РНК системы РНК-интерференции (об этом подробнее в разделе 5.3).

Основные инструменты эпигенетического сайленсинга транспозонов – это метилирование ДНК и модификации гистоновых белков, приводящие к формированию гетерохроматина.

Метилирование ДНК Это присоединение метильной группы (-CH₃) к цитозину (C). У млекопитающих метилирование происходит преимущественно в составе динуклеотидов CpG. Почему именно CpG? Эта симметричная последовательность удобна для копирования паттерна метилирования на новую цепь ДНК после репликации. В отличие от промоторов активных генов, где CpG-богатые "островки" обычно не метилированы, последовательности транспозонов часто плотно метилированы по CpG, что является важным отличительным знаком и способствует их подавлению. Ферменты, осуществляющие эту реакцию, называются ДНК-метилтрансферазами (DNMTs). Метилирование ДНК подавляет транспозоны двумя путями:

Прямое ингибирование транскрипции: Метильные группы могут мешать связыванию факторов транскрипции.
Привлечение репрессорных белков: Метилированная ДНК узнается белками, которые привлекают другие комплексы, подавляющие транскрипцию и уплотняющие хроматин [59]. Паттерны метилирования могут наследоваться при репликации благодаря "поддерживающим" метилтрансферазам, обеспечивая стабильность "молчания".

Модификации гистонов и гетерохроматин ДНК намотана на белки-гистоны. Химические модификации "хвостов" гистонов служат "кодом", определяющим структуру хроматина. Для подавления транспозонов важны репрессивные гистоновые метки, такие как метилирование лизина 9 в гистоне H3 (H3K9me3) и деацетилирование лизинов. Эти метки узнаются белками (например, HP1), которые вызывают конденсацию хроматина, переводя его в транскрипционно неактивное состояние – гетерохроматин. Большинство транспозонных последовательностей упакованы именно в гетерохроматин [60]. Насколько надежна эта "упаковка"? Гетерохроматин – это, как правило, очень стабильная структура, эффективно подавляющая активность ТЭ. Однако он не абсолютно непроницаем и неизменен. В определенных условиях (стресс, развитие, болезни) структура хроматина может меняться, и "спящие" транспозоны могут получить шанс на реактивацию.

Взаимодействие механизмов Метилирование ДНК и модификации гистонов тесно взаимосвязаны и часто работают согласованно, усиливая друг друга (метилированная ДНК привлекает гистоновые модификаторы и наоборот). Это создает устойчивую систему подавления. Но являются ли эти эпигенетические метки необратимыми? Нет, в отличие от мутаций в ДНК, эпигенетические модификации принципиально обратимы. В клетке существуют ферменты, способные удалять метильные группы с ДНК и изменять модификации гистонов. Эта обратимость важна для нормального развития, но она же создает и потенциальную возможность для реактивации ранее "заглушенных" транспозонов при изменении клеточных условий или нарушении работы систем контроля.

Таким образом, эпигенетический сайленсинг через метилирование ДНК и формирование гетерохроматина является мощным и стабильным механизмом долгосрочного контроля над активностью транспозонов, играющим критическую роль в поддержании стабильности генома.

5.3. РНК-интерференция: страж зародышевой линии и сомы

Помимо эпигенетических механизмов, "заглушающих" ДНК транспозонов, клетка располагает еще одной мощной линией обороны, действующей на уровне РНК – это РНК-интерференция (RNAi). Эта система использует короткие молекулы РНК для распознавания и подавления экспрессии генов или транспозонов по принципу комплементарности [58]. РНК-интерференция часто тесно связана с эпигенетическим сайленсингом, направляя его на нужные участки генома.

Общий принцип работы РНКi: короткая РНК связывается с белком семейства Argonaute (Ago). Этот комплекс использует малую РНК как "гида" для поиска комплементарной мишени (обычно РНК). Связывание запускает подавление – либо деградацию РНК-мишени, либо подавление трансляции, либо модификацию хроматина.

Для контроля транспозонов особенно важны два пути: siRNA и piРНК.

siRNA-путь (малые интерферирующие РНК) Этот механизм часто запускается присутствием двуцепочечной РНК (дцРНК). Откуда она берется от транспозонов? Это может быть результатом считывания РНК с ТЭ, встроившихся рядом в противоположных ориентациях, или считывания самого ТЭ в обе стороны, или образования шпилек РНК у элементов с инвертированными повторами. Клетка распознает такую дцРНК как "аномальную".

Процессинг: Фермент Dicer нарезает дцРНК на короткие (~21-24 нуклеотида) двуцепочечные siRNA.
Действие: Одна цепь siRNA загружается в белок Ago, формируя RISC (RNA-induced silencing complex). RISC находит комплементарную мРНК транспозона.
Результат: Обычно происходит разрезание и деградация мРНК-мишени (пост-транскрипционный сайленсинг, PTGS). У некоторых организмов siRNA-комплексы могут также направлять транскрипционный сайленсинг (TGS) через модификацию хроматина [61]. siRNA-путь активен во многих соматических клетках и важен у растений, грибов, беспозвоночных.

piРНК-путь (PIWI-interacting RNA) Этот путь является ключевым механизмом защиты от транспозонов в зародышевых клетках (герминальной линии) большинства животных. Почему именно там? Геном зародышевых клеток передается потомству, и его целостность критически важна для выживания вида. Неконтролируемая активность ТЭ в гермине привела бы к накоплению мутаций из поколения в поколение. Поэтому здесь действует особо мощная система защиты на основе piРНК, обладающая "памятью" и способностью к амплификации ответа. Соматические клетки могут полагаться на менее сложные механизмы.

piРНК: Малые РНК (~24-31 нуклеотид), образуются из транскриптов piРНК-кластеров (часто содержат фрагменты ТЭ) сложным, Dicer-независимым путем.
PIWI-белки: piРНК связываются со специфической подгруппой белков Argonaute – PIWI-белками.
Двойное действие: Комплексы PIWI-piRNA осуществляют защиту двумя способами:

Пост-транскрипционный сайленсинг: В цитоплазме они находят и разрезают мРНК активных транспозонов. Этот процесс часто включает механизм "пинг-понг" амплификации. Как он работает? Если первичная piРНК в комплексе с одним PIWI белком разрезает мРНК транспозона, то этот разрез "запускает" образование вторичной piРНК (комплементарной первичной) в комплексе с другим PIWI белком. Этот второй комплекс может затем найти и разрезать РНК, считанную с piРНК-кластера (часто антисмысловую), генерируя снова первичную piРНК. Этот цикл взаимного разрезания и генерации новых piРНК позволяет быстро нарастить количество piРНК, нацеленных против активных транспозонов, используя кластеры как "библиотеку" последовательностей-"врагов".
Транскрипционный сайленсинг (Эпигенетический): Комплексы PIWI-piRNA могут перемещаться в ядро. Как происходит "наведение"? Считается, что комплекс PIWI-piRNA связывается с зарождающимися транскриптами транспозона в ядре и привлекает к этому локусу ферменты, отвечающие за метилирование ДНК и установку репрессивных меток на гистонах (H3K9me3), таким образом "помечая" его для долгосрочного молчания (формирование гетерохроматина) [62].

Синергия с эпигенетикой Важно понимать, что РНК-интерференция и эпигенетический сайленсинг часто работают рука об руку. Пути siRNA и особенно piRNA могут служить "наводчиками", указывая эпигенетической машинерии, какие именно участки генома (транспозоны) нужно "заглушить" на долгое время. Это создает многоуровневую и надежную систему обороны.

В заключение, РНК-интерференция предоставляет клетке мощный и специфичный инструмент для обнаружения и подавления активности транспозонов как на уровне РНК, так и на уровне ДНК. piРНК-путь играет особо важную роль в защите генома зародышевой линии у животных.

5.4. Факторы рестрикции: прямая атака на транспозоны (APOBEC и другие)

Помимо глобальных систем подавления, таких как эпигенетический сайленсинг и РНК-интерференция, клетки обладают еще одним уровнем защиты – набором белков, известных как факторы рестрикции. Этот термин пришел из вирусологии и обозначает клеточные белки, которые могут напрямую вмешиваться в жизненный цикл вируса или, как в нашем случае, мобильного элемента, блокируя его на определенной стадии [63]. В отличие от эпигенетики или РНКi, которые часто "глушат" экспрессию, факторы рестрикции могут физически взаимодействовать с компонентами транспозона (РНК, ДНК или белками) и инактивировать их.

Ярким примером таких факторов, играющих роль в защите от ретроэлементов, являются белки семейства APOBEC.

Что это такое? Белки APOBEC – это ферменты, цитидиндезаминазы, превращающие цитидин (C) в уридин (U). Особую роль играют белки подгруппы APOBEC3.
Механизм действия против ретроэлементов: Белки APOBEC3 экспрессируются в цитоплазме и могут взаимодействовать с компонентами ретроэлементов. Ключевой момент – стадия обратной транскрипции, когда образуется одноцепочечная ДНК-копия (кДНК). Белки APOBEC3 "атакуют" именно эту уязвимую одноцепочечную кДНК. Почему именно ее, а не ДНК клетки? Главная причина – субстратная специфичность: APOBEC3 предпочитают одноцепочечную ДНК, которая как раз и образуется временно при обратной транскрипции. Двуцепочечная ДНК генома, упакованная в хроматин, является гораздо менее подходящей мишенью. Таким образом, APOBEC используют уязвимость жизненного цикла ретроэлементов, проводя массовое дезаминирование цитидинов (C) в уридины (U).
Последствия: Появление урацила в ДНК – ошибка. При синтезе второй цепи ДНК напротив U встраивается аденин (A). В результате в итоговой двуцепочечной ДНК-копии транспозона происходит множество замен гуанина (G) на аденин (A) – G-to-A гипермутация. Массовые мутации в ДНК-копии обычно приводят к появлению стоп-кодонов или нефункциональных аминокислот, делая новую копию нефункциональной. Кроме того, наличие урацила в ДНК может активировать системы репарации, способные привести к деградации дефектной копии [64].
Исход для транспозона: (...)ранее в тексте... Могут ли ТЭ защититься? Да, по крайней мере, ретровирусы выработали контрмеры (например, белок Vif ВИЧ уничтожает APOBEC3G). Возможно, и у ретротранспозонов есть свои способы противодействия.

Не опасно ли это для самой клетки? Да, это "обоюдоострый меч". Хотя APOBEC нацелены на ретроэлементы, при определенных условиях (например, при воспалении) они могут атаковать и одноцепочечные участки ДНК самой клетки. Такие "ошибки" вызывают мутации в геноме хозяина, и характерные "APOBEC-подписи" обнаруживаются во многих типах раковых опухолей, указывая на их потенциальный вклад в геномную нестабильность и онкогенез [65].

Помимо APOBEC, предполагается, что и другие клеточные белки могут выполнять функции факторов рестрикции против транспозонов, хотя их роль изучена в меньшей степени (например, TRIM5α, SAMHD1, белки систем репарации ДНК). А существуют ли белки, атакующие именно ДНК-транспозоны? Факторы рестрикции, специфично нацеленные на Класс II элементы или их транспозазы по аналогии с APOBEC для Класса I, изучены значительно хуже. Основными механизмами контроля ДНК-транспозонов, по-видимому, остаются РНК-интерференция и эпигенетическое подавление, хотя исследования в этой области продолжаются.

Таким образом, факторы рестрикции представляют собой еще один эшелон обороны генома, использующий стратегию прямой "атаки" и модификации компонентов мобильных элементов для их инактивации. Эта система особенно важна для противодействия ретроэлементам.

5.5. Стресс-индуцированная активация транспозонов: исключение из правил?

Мы подробно рассмотрели мощные системы контроля, которые геном хозяина использует для подавления активности мобильных элементов. Казалось бы, транспозоны должны находиться под постоянным и жестким надзором. Однако оказывается, что этот контроль не всегда абсолютен. В ряде случаев наблюдается временное повышение активности транспозонов в ответ на различные стрессовые воздействия на клетку или организм [66].

Какие виды стресса могут спровоцировать "пробуждение" транспозонов? Их спектр довольно широк:

Абиотические стрессы: Резкие изменения температуры, засуха, УФ-облучение и др.
Биотические стрессы: Инфекции, ранения.
Геномный стресс: Межвидовая гибридизация, полиплоидизация, массовые разрывы хромосом. Подтвердилась ли идея МакКлинток о "шоке генома"? Да, во многом. Сейчас хорошо известно, что именно такие события "геномного стресса", особенно у растений, часто сопровождаются дерегуляцией эпигенетических механизмов и вызывают массовую активацию и перемещение транспозонов, что, в свою очередь, способствует быстрой перестройке и эволюции гибридных или полиплоидных геномов. Реагируют ли все транспозоны одинаково? Нет, разные семейства ТЭ могут иметь разную чувствительность к стрессу. Это зависит от их собственных регуляторных последовательностей и от того, насколько глубоко они подавлены в "спокойных" условиях.

Каким образом стресс может приводить к активации транспозонов? Существует несколько возможных механизмов:

Ослабление защитных систем хозяина: Стресс может вызывать глобальные изменения в эпигенетическом ландшафте или временно подавлять РНК-интерференцию, ослабляя "оковы" сайленсинга.
Прямая активация промоторов ТЭ: Некоторые транспозоны содержат в своих регуляторных областях стресс-чувствительные элементы (например, элементы ответа на тепловой шок), которые напрямую активируются клеточными сигнальными путями стресса.
Повышение доступности компонентов: Стресс может влиять на стабильность мРНК/белков ТЭ или доступность необходимых клеточных факторов [67]. Активация при разных стрессах происходит по одному принципу? Вероятно, нет. Ослабление общих защитных систем может приводить к некоторой активации разных ТЭ при многих видах стресса. Однако прямая активация через стресс-чувствительные элементы будет специфична и для типа стресса, и для конкретного транспозона.

Каково эволюционное значение этого явления? Гипотеза предполагает, что стресс-индуцированная активация транспозонов может быть адаптивным механизмом. В условиях стресса, когда обычные приспособления недостаточны, "взрыв" транспозиционной активности может резко увеличить генетическое разнообразие, создавая новые мутации и перестройки. Среди них случайно могут оказаться полезные варианты, повышающие приспособленность к стрессу. Таким образом, транспозоны могут выступать как "генераторы изменчивости по требованию". Насколько убедительна эта гипотеза? Существуют примеры, особенно у растений, где стресс-индуцированные мутации от ТЭ действительно привели к адаптивным изменениям. Однако доказать, что это целенаправленная "стратегия", а не просто опасный побочный эффект нарушения клеточного контроля, сложно. Риск накопления вредных мутаций очень велик, и адаптивная польза может реализовываться лишь в редких, критических для выживания вида ситуациях. Дискуссии о балансе вреда и пользы продолжаются [68].

Поэтому вопрос о том, является ли стресс-индуцированная активация транспозонов действительно адаптивной стратегией или же просто неизбежным следствием нарушения клеточного гомеостаза, остается предметом активных исследований. Несомненно лишь то, что это явление связывает активность мобильных элементов с условиями окружающей среды и состоянием организма-хозяина.

5.6. Коэволюция: "гонка вооружений" между транспозонами и хозяином

Взаимодействие между мобильными генетическими элементами и геномом их хозяина – это не статичная картина, а динамичный процесс коэволюции, продолжающийся миллионы лет. Его часто описывают с помощью метафоры "гонки вооружений": обе стороны – транспозоны, стремящиеся к размножению, и хозяин, стремящийся сохранить стабильность своего генома, – постоянно вырабатывают новые стратегии и контрстратегии в ответ друг на друга [69].

Адаптации со стороны хозяина (защита и толерантность): Геном хозяина развил сложные системы для подавления активности транспозонов: эпигенетический сайленсинг, РНК-интерференцию и факторы рестрикции. Эти системы постоянно эволюционируют, чтобы распознавать новые или мутировавшие транспозоны. Хозяин также может развивать толерантность, например, направляя вставки ТЭ в "безопасные гавани".
Адаптации со стороны транспозонов (выживание и контрзащита): Транспозоны тоже эволюционируют, чтобы выживать:

Уклонение от распознавания: Мутации в последовательностях ТЭ могут сделать их неузнаваемыми для малых РНК или изменить сайты связывания для факторов рестрикции (например, потеря CpG-сайтов).
Подавление защиты хозяина: Теоретически ТЭ могут кодировать белки, ингибирующие защитные системы клетки.
Саморегуляция: Чтобы не убить своего хозяина, многие транспозоны выработали механизмы самоограничения. Зачем транспозону себя ограничивать? Это стратегия "разумного паразита". Слишком агрессивное размножение может убить хозяина до того, как он оставит потомство, что приведет к гибели и самого "успешного" транспозона. Поэтому отбор может благоприятствовать вариантам ТЭ, которые поддерживают умеренный уровень активности, обеспечивая свое долгосрочное выживание вместе с линией хозяина.
Выбор "безопасных гаваней": Отбор может благоприятствовать ТЭ, преимущественно встраивающимся в менее опасные участки генома.
Горизонтальный перенос генов (HGT): Транспозоны могут "сбегать" из генома хозяина, где накопились эффективные механизмы защиты, в геном другого, потенциально "наивного" вида [70]. Как часто и каким образом? Горизонтальный перенос ТЭ между эукариотами случается чаще, чем думали раньше, хотя и реже вертикальной передачи. Механизмы могут включать перенос вирусами, которые случайно захватывают куски ДНК хозяина, или через паразитов и симбионтов. Некоторые ТЭ, как mariner, особенно успешно используют HGT.

Динамическое равновесие: Эта коэволюционная "гонка вооружений" приводит к постоянно меняющемуся балансу сил. Иногда в геном проникает новый агрессивный транспозон, вызывая вспышку активности. Затем наступает период затишья, когда большинство копий ТЭ подавлено. Иногда транспозон может быть "одомашнен". Означает ли это конец "гонки"? Для конкретной "одомашненной" копии – да, она теперь сохраняется отбором за ее новую функцию для хозяина и перестает быть "эгоистом" в плане мобильности. Однако другие, "дикие" копии этого же семейства транспозонов в геноме могут по-прежнему оставаться под контролем и участвовать в "гонке вооружений". Старые семейства ТЭ постепенно деградируют, уступая место новым. Кто же "побеждает" в этой гонке? По-видимому, окончательного победителя нет. Это скорее вечный коэволюционный процесс, где баланс сил постоянно смещается, и обе стороны – геном хозяина и популяции транспозонов – продолжают существовать и влиять друг на друга.

Таким образом, непрекращающееся взаимодействие и конфликт между транспозонами и их хозяевами является важным двигателем эволюции. Оно формирует не только разнообразие самих мобильных элементов, но и сложность защитных и регуляторных систем генома хозяина, внося вклад в общую динамику и пластичность геномов в живой природе.

Глава 6: Эволюционная роль транспозонов: двигатели изменений генома

6.1. Сырье для эволюции: транспозоны как источник генетической изменчивости

Фундаментальный принцип эволюционной теории гласит: эволюция путем естественного отбора возможна только при наличии наследственной изменчивости в популяциях. Отбор действует на существующие различия между особями, благоприятствуя тем вариантам, которые лучше приспособлены к текущим условиям среды. Но откуда берется эта изменчивость, это "сырье" для эволюции?

Традиционно основными источниками считались точечные мутации и генетическая рекомбинация. Однако с открытием мобильных генетических элементов стало ясно, что они являются еще одним, а во многих случаях – основным генератором генетического разнообразия, особенно в геномах эукариот. Насколько велик их вклад? Хотя точечные мутации создают "точечные" изменения, транспозоны генерируют более крупные перестройки и регуляторные инновации. Во многих эукариотических геномах их вклад в структурную и регуляторную изменчивость огромен, и без них эволюция геномов, вероятно, шла бы значительно медленнее и по другим путям. Их способность перемещаться и взаимодействовать с геномом хозяина приводит к возникновению широчайшего спектра генетических изменений:

Создание новых аллелей через инсерционный мутагенез: Вставки транспозонов могут напрямую изменять гены, "ломая" их или тонко перенастраивая их работу, создавая новые варианты (аллели).
Генерация крупномасштабных перестроек генома: Рекомбинация между копиями транспозонов приводит к делециям, дупликациям, инверсиям и транслокациям, изменяя количество и расположение генов.
Перетасовка генных фрагментов: Некоторые транспозоны (например, Helitrons) способны захватывать и перемещать фрагменты генов (экзоны), способствуя созданию новых белковых структур [71].

Таким образом, мобильные элементы постоянно "перемешивают" и модифицируют геном. Это может приводить к увеличению эволюционной пластичности или эволюционируемости (evolvability) видов – их способности генерировать адаптивные изменения. Особенно это может быть важно в периоды стресса, когда активность транспозонов может возрастать. Но всегда ли это хорошо? Повышенная изменчивость – это палка о двух концах. В быстро меняющихся условиях она может спасти вид. Однако в стабильной среде постоянный поток новых мутаций (часто вредных) может снижать среднюю приспособленность. Поэтому оптимальный уровень активности ТЭ – это всегда компромисс между стабильностью и пластичностью. Важно помнить, что даже если стресс активирует ТЭ, сами вызываемые ими мутации не являются "направленными" на решение проблемы. Стресс может повышать частоту мутагенеза, но сами вставки случайны по отношению к их полезности. Отбор затем "подхватывает" редкие удачные варианты.

В отличие от точечных мутаций, транспозоны способны вызывать более радикальные и разнообразные изменения. Одинаково ли важна их роль для простых и сложных организмов? Транспозоны важны на всех уровнях. У прокариот они ключевые факторы адаптации и горизонтального переноса генов. У сложных эукариот, с их большими геномами и сложной регуляцией, ТЭ сыграли колоссальную роль в формировании архитектуры генома, дупликации генов, создании новых регуляторных сетей и, возможно, в эволюции самой сложности. Именно поэтому их роль как источника сырья для эволюционного процесса трудно переоценить. Они не просто "генетический мусор", но и мощные двигатели генетических изменений.

6.2. "Одомашнивание" транспозонов: экзаптация генов и последовательностей

Мы установили, что транспозоны служат мощным источником генетической изменчивости. Хотя многие из этих изменений вредны или нейтральны, иногда геном хозяина находит способ использовать фрагменты мобильных элементов или кодируемые ими белки для своих собственных нужд, придавая им совершенно новые, полезные функции. Этот удивительный эволюционный процесс называется экзаптацией или, в контексте мобильных элементов, молекулярным "одомашниванием" (domestication).

Экзаптация – это использование признака (в данном случае, последовательности ДНК или белка транспозона), который изначально эволюционировал для одной цели (самокопирование и перемещение), для выполнения совершенно другой функции, полезной уже для организма-хозяина. А как ученые вообще понимают, что какой-то современный ген или регуляторный участок ДНК – это на самом деле "одомашненный" транспозон? Основные "улики" – это сходство последовательности гена/элемента хозяина с известными транспозонами, наличие остаточных структурных признаков (следов LTR/TIR, характерных белковых доменов) и филогенетический анализ, показывающий, что данный элемент появился в геноме только у определенной группы видов. Вместо того чтобы просто бороться с транспозонами, геном хозяина в некоторых случаях смог "приручить" и "перепрофилировать" эти бывшие эгоистичные элементы.

Что именно может быть "одомашено"? Практически любой компонент транспозона:

Гены транспозонов: Ферменты (транспозазы, интегразы) могут утратить свою мобилизующую способность, но приобрести новую функцию.
Регуляторные последовательности: Промоторы, энхансеры, инсуляторы ТЭ могут быть "рекрутированы" для контроля генов хозяина.
Некодирующие последовательности: Фрагменты ТЭ могут экзонизироваться (включаться в белки) или давать начало функциональным некодирующим РНК.
Концевые повторы (TIRs или LTRs): Могут использоваться как регуляторные элементы.

Какие новые функции они приобретают? Часто новые роли связаны с исходными "навыками" транспозонов – работой с ДНК, РНК и хроматином. Так, транспозазы могут превращаться в регуляторы транскрипции или ферменты репарации/рекомбинации; регуляторные участки ТЭ встраиваются в генные сети хозяина; РНК-связывающие белки ТЭ могут эволюционировать в регуляторы РНК хозяина. Биохимический "инструментарий" транспозонов оказывается удобным "конструктором" для эволюции новых клеточных систем.

Как происходит "одомашнивание"? Обычно это многоступенчатый процесс. Сначала транспозон должен потерять способность к активному перемещению из-за мутаций, став стабильной частью генома. Всегда ли это обязательное условие? В большинстве известных случаев происходит инактивация мобильности, так как активный элемент может легко разрушить свою новую полезную функцию. Стабильность обычно предпочтительна для надежного выполнения клеточной роли. Затем случайные мутации в этой "замороженной" последовательности могут привести к появлению новой, полезной для хозяина функции. Если эта функция дает преимущество, естественный отбор будет поддерживать ее сохранение и оптимизацию [72].

Процесс экзаптации ярко демонстрирует творческий потенциал эволюции. Он показывает, что геном – это динамичная система, способная перерабатывать даже изначально "паразитические" элементы. Насколько много в нашем геноме таких "одомашненных" транспозонов? Гораздо больше, чем считалось ранее! Хотя "одомашнивание" целых белков ТЭ встречается не так часто, рекрутирование регуляторных последовательностей ТЭ для управления генами хозяина, а также экзонизация фрагментов ТЭ и их превращение в некодирующие РНК, по-видимому, являются массовыми процессами, внесшими огромный вклад в формирование сложности современных геномов, особенно у млекопитающих. "Генетический мусор" вчерашнего дня может стать важным функциональным элементом сегодня.

В следующих подразделах мы рассмотрим несколько ярких и хорошо изученных примеров такого "одомашнивания" транспозонов.

6.2.1. V(D)J-рекомбинация и происхождение RAG1/2

Один из самых поразительных и хорошо изученных примеров "одомашнивания" транспозона лежит в основе адаптивной иммунной системы всех челюстных позвоночных. Ключевой процесс, позволяющий нам вырабатывать огромное разнообразие антител и Т-клеточных рецепторов, – это V(D)J-рекомбинация.

Что это такое? В геноме незрелых лимфоцитов гены рецепторов представлены наборами сегментов: V, D и J. В ходе созревания клетки происходит рекомбинация ДНК: случайно выбирается по одному сегменту каждого типа, участки ДНК между ними вырезаются, а выбранные сегменты соединяются, образуя уникальный ген. Именно эта случайная сборка и создает колоссальное разнообразие рецепторов.

За запуск V(D)J-рекомбинации отвечают два белка – RAG1 и RAG2. Они работают в комплексе, узнают сигнальные последовательности рекомбинации (RSS) рядом с V, D и J сегментами и вносят разрывы ДНК между RSS и кодирующим сегментом. Каковы их роли? RAG1 содержит каталитический DDE-мотив и отвечает за разрезание ДНК. RAG2 сам не режет ДНК, но абсолютно необходим: он стабилизирует связывание RAG1 с RSS, помогает "нацеливать" комплекс на правильные участки хроматина и координирует процесс разрезания. Они образуют неразлучный функциональный тандем. Затем клеточные системы репарации ДНК (NHEJ) соединяют кодирующие концы.

Удивительно, но гены RAG1 и RAG2 найдены только у челюстных позвоночных, и их механизм действия сильно напоминает работу транспозазы ДНК-транспозона. Доказательства этого:

RAG1 содержит DDE-мотив.
Комплекс RAG1/RAG2 in vitro способен функционировать как транспозаза: вырезать сегмент ДНК между RSS (похожими на TIRs) и встроить его в новое место.
Филогенетический анализ указывает на происхождение RAG1/RAG2 от транспозазы древнего ДНК-транспозона из суперсемейства Transib [73].

Наиболее вероятный сценарий "одомашнивания": в геном предка челюстных позвоночных встроился активный Transib-подобный транспозон. Было ли случайностью, что он встроился именно рядом с генами иммунных рецепторов? Возможно, это была удачная случайность, но не исключено, что эта область генома была по каким-то причинам более "привлекательной" для встраивания. Так или иначе, именно это соседство создало предпосылки для последующего "одомашнивания". Со временем ген транспозазы мутировал, потеряв способность эффективно перемещать сам себя, но сохранив способность резать ДНК рядом с RSS. Клетка "поставила на службу" эту активность для сборки генов рецепторов, ограничив экспрессию RAG только лимфоцитами. Как же клетка подавляет опасную транспозонную активность RAG? Во-первых, их экспрессия строго ограничена по времени и типу клеток. Во-вторых, активность RAG-белков дополнительно регулируется модификациями. В-третьих, возможно, сам механизм V(D)J эволюционно "заточен" так, чтобы направлять концы на репарацию, а не на новую вставку. Тем не менее, сбои в контроле могут приводить к лимфомам и лейкозам.

Таким образом, система V(D)J-рекомбинации – результат уникального "одомашнивания" транспозазы. Насколько это было важно? Появление V(D)J-рекомбинации и адаптивного иммунитета стало одним из ключевых событий в эволюции позвоночных. Оно дало челюстным позвоночным огромное преимущество в борьбе с патогенами, позволило им освоить новые экологические ниши и во многом определило их дальнейший эволюционный успех и разнообразие. Это ярчайший пример того, как "эгоистичный" элемент может быть преобразован в жизненно важный компонент.

6.2.2. Теломераза и ее связь с ретроэлементами

Еще один фундаментальный процесс в эукариотических клетках, тесно связанный по своему происхождению с мобильными элементами, – это поддержание длины теломер, защитных "колпачков" на концах линейных хромосом.

У эукариот существует "проблема недорепликации концов": обычные ДНК-полимеразы не способны полностью скопировать самые концы ДНК, и с каждым делением клетки хромосомы немного укорачиваются. Это ограничивает число делений большинства соматических клеток.

Механизмом, противодействующим укорочению, является фермент теломераза. Она достраивает концы хромосом, добавляя короткие повторяющиеся последовательности ДНК (TTAGGG у человека), образующие теломеры. Активность теломеразы важна в зародышевой линии, стволовых и раковых клетках.

По своей структуре теломераза является рибонуклеопротеином:

TERT (Telomerase Reverse Transcriptase): Каталитическая белковая субъединица, являющаяся специализированной обратной транскриптазой [74].
TERC (Telomerase RNA Component): Молекула РНК, которая содержит короткий участок, служащий матрицей для синтеза теломерных ДНК-повторов. Откуда взялась эта РНК? В отличие от белка TERT, РНК-компонент TERC, по-видимому, не происходит напрямую от транспозонов. Вероятно, это клеточная некодирующая РНК, которая была "рекрутирована" для работы в паре с "одомашненной" обратной транскриптазой. Таким образом, теломераза – это химерный комплекс.

Принцип работы теломеразы: белок TERT использует РНК-матрицу (TERC) для синтеза ДНК (теломерных повторов). Зачем нужны повторы? Использование короткой повторяющейся последовательности, "зашитой" в РНК-матрице TERC, позволяет ферменту TERT итеративно (многократно) достраивать конец хромосомы. После синтеза одного повтора теломераза может немного сдвинуться и синтезировать следующий, используя тот же самый короткий участок РНК-матрицы. Это эффективный способ удлинения теломер.

Где же связь с транспозонами? Белок TERT эволюционно родственен обратным транскриптазам (RT), кодируемым не-LTR ретротранспозонами (такими как LINEs) [75]. Почему именно их? Возможно, их механизм, часто включающий праймирование синтеза ДНК с 3'-конца РНК (как при TPRT), оказался биохимически более "удобным" для адаптации к задаче достраивания 3'-концов хромосом с использованием внутренней РНК-матрицы, чем более сложный механизм LTR-элементов.

Преобладающая гипотеза гласит, что TERT произошла в результате "одомашнивания" гена RT древнего не-LTR ретротранспозона. Этот фермент был "пойман" клеткой и приспособлен для решения проблемы недорепликации концов, возникшей с появлением линейных хромосом.

Таким образом, фермент, изначально развившийся для мобильности "эгоистичного" элемента, был поставлен на службу клетке. А все ли эукариоты используют теломеразу? Нет, существуют и альтернативные пути. Самый известный пример – плодовая мушка дрозофила, которая поддерживает длину теломер за счет целенаправленной транспозиции особых не-LTR ретротранспозонов (семейств HeT-A, TART) на концы хромосом [76]. Это показывает, что даже решение проблемы концов хромосом может быть связано с мобильными элементами разными путями! Также существуют механизмы поддержания теломер на основе рекомбинации (ALT), активные, например, в некоторых раковых клетках. Тем не менее, для большинства эукариот теломераза, имеющая транспозонное происхождение, является ключевым ферментом поддержания целостности генома.

6.2.3. Синцитины и формирование плаценты

Еще одним удивительным примером "одомашнивания" мобильных элементов, а точнее, эндогенных ретровирусов (ERV), является история белков синцитинов, играющих ключевую роль в формировании плаценты у млекопитающих. Как же обходятся другие животные? Рептилии и птицы откладывают яйца. Сумчатые млекопитающие имеют очень короткую беременность и простую плаценту без слияния клеток, а основное развитие идет в сумке. Уникальный синцитиальный слой плаценты, образуемый благодаря синцитинам, – это специфическая адаптация именно плацентарных (эутериевых) млекопитающих, позволяющая обеспечить длительное внутриутробное развитие.

Одной из важнейших структур этой плаценты является синцитиотрофобласт – гигантский многоядерный клеточный слой (синцитий), формирующий основную поверхность контакта между тканями матери и плода. Этот слой образуется путем массового слияния клеток-предшественников. За процесс слияния отвечают белки синцитины.

Каково же происхождение этих генов? Анализ показал: гены синцитинов – это "одомашненные" гены env (ген оболочки) различных эндогенных ретровирусов (ERV). У активных ретровирусов белки Env обеспечивают слияние вирусной мембраны с мембраной клетки-хозяина. То есть, они обладают фузогенной активностью.

Сценарий экзаптации выглядит так:

Древние ретровирусы встраивались в геном предков млекопитающих (ERV).
Большинство генов env инактивировались.
Однако в некоторых случаях ген env сохранял свою способность вызывать слияние. Как он избежал инактивации? Хотя многие копии env действительно быстро "ломались" мутациями, большое число разных ERV-интеграций давало много шансов. Возможно, некоторые копии env случайно избежали мутаций достаточно долго или даже давали небольшое, не связанное с плацентой, преимущество, что способствовало их сохранению до момента "призвания" на новую роль.
Геном хозяина "перепрофилировал" этот ген: его экспрессия была ограничена клетками плаценты.
Фузогенная активность бывшего вирусного белка (теперь синцитина) была использована для слияния клеток и формирования синцитиотрофобласта.

Интересно, что процесс "одомашнивания" генов env происходил независимо несколько раз в разных линиях млекопитающих! У человека, грызунов, зайцеобразных работают разные синцитины, произошедшие от разных ERV [77]. Почему не один общий синцитин? Вероятно, "подходящие" для одомашнивания ERV с активными env генами интегрировались в геномы предков млекопитающих уже после того, как основные группы начали расходиться. Каждая линия затем использовала те "вирусные запчасти", которые оказались доступны именно в ее геноме.

А были ли "одомашнены" другие части ERV, кроме генов env? Да, безусловно. Особенно важную роль сыграли регуляторные элементы из LTR эндогенных ретровирусов. Множество LTR были кооптированы как промоторы или энхансеры для управления экспрессией генов хозяина, внося вклад в эволюцию сложных регуляторных сетей. Исследуется также возможная кооптация и других вирусных белков.

Таким образом, ген, изначально служивший вирусу для заражения клеток, стал незаменимым инструментом для размножения млекопитающих. Это подчеркивает глубокую связь между мобильными элементами и эволюцией сложных признаков.

6.2.4. Другие примеры экзаптации

Примеры происхождения RAG-белков, теломеразы и синцитинов от мобильных элементов являются яркими, но далеко не единственными случаями "одомашнивания" транспозонов. Геномы эукариот изобилуют следами таких событий. Рассмотрим еще несколько примеров.

Ген SETMAR: Уникальный ген человекообразных приматов. Он образовался в результате того, что ДНК-транспозон Hsmar1 встроился в ген хозяина с SET-доменом (метилтрансфераза гистонов). Как могло произойти такое точное слияние? Вероятно, транспозон встроился в интрон гена SET, а затем в результате изменений в сплайсинге (или других перестроек) его кодирующая область (ген транспозазы) оказалась соединена с экзонами гена SET. Образовался химерный белок SETMAR, сохранивший ДНК-связывающую активность транспозазы и каталитическую активность SET-домена. Предполагается его участие в репарации ДНК и поддержании стабильности генома [78]. Хотя такие события слияния генов из-за ТЭ не очень часты, они являются одним из путей создания белков с новыми комбинациями доменов.
Белки KRAB-ZFP и контроль ТЭ: У позвоночных существует огромное семейство транскрипционных факторов KRAB-ZFP. KRAB-домен подавляет транскрипцию, а цинковые пальцы специфично связывают ДНК. Основная функция многих из них – узнавать и подавлять экспрессию ТЭ! Они связываются с ТЭ и через KRAB-домен привлекают комплексы, устанавливающие метки гетерохроматина. Как выглядит "гонка вооружений" в этом случае? Постоянно возникают новые семейства ТЭ. В ответ геном хозяина быстро эволюционирует новые гены KRAB-ZFP (путем дупликаций и мутаций), чьи цинковые пальцы специфично узнают эти новые ТЭ. Транспозоны, в свою очередь, мутируют в узнаваемых ZFP последовательностях, пытаясь "сбежать" от подавления. Это приводит к непрерывной коэволюционной динамике [79]. По сути, геном хозяина "экзаптировал" модульную структуру этих факторов для создания специфической системы защиты.
Центромеры и кинетохоры: Центромера – участок прикрепления нитей веретена деления. У многих организмов центромерные районы содержат массивы сателлитной ДНК, часто имеющей происхождение от транспозонов. Зачем центромере "мусорные" повторы? Оказывается, они не мусорные. Эти массивы повторов создают уникальную структуру хроматина для сборки кинетохора. С них считываются некодирующие РНК, которые также участвуют в этом процессе, помогая привлекать ключевые белки. Более того, один из основных ДНК-связывающих белков центромеры, CENP-B, по-видимому, произошел от транспозазы ДНК-транспозона семейства pogo. Сохранил ли он старые "навыки"? Частично. CENP-B утратил способность "резать и клеить" ДНК, но сохранил специфичность связывания с определенной последовательностью ДНК (CENP-B box), часто встречающейся в центромерных повторах. Эта способность теперь используется им для выполнения структурной роли [80].

Это лишь несколько примеров. Можно добавить сюда еще множество случаев экзонизации фрагментов ТЭ, кооптации регуляторных элементов ТЭ, возникновения функциональных длинных некодирующих РНК из ТЭ-транскриптов. Насколько это распространенное явление? Гораздо более распространенное, чем считалось ранее! Особенно массовыми процессами являются рекрутирование регуляторных последовательностей ТЭ и их превращение в некодирующие РНК. Все это свидетельствует о том, что "одомашнивание" транспозонов – это постоянно действующий и мощный механизм эволюционных инноваций [72].

6.3. Эволюция регуляторных сетей: распространение сайтов связывания

Одной из наиболее захватывающих и активно изучаемых областей влияния транспозонов на эволюцию является их роль в формировании и перестройке генных регуляторных сетей (Gene Regulatory Networks, GRNs). Сложность организма во многом определяется не только набором генов, но и сложной системой их регуляции – тем, когда, где и в ответ на какие сигналы гены включаются и выключаются. GRNs представляют собой комплекс взаимодействий между генами, регуляторными белками (факторами транскрипции, TFs) и регуляторными участками ДНК.

Мобильные элементы служат эффективным инструментом для "перепрошивки" этих сетей, в первую очередь за счет распространения сайтов связывания факторов транскрипции (TFBS).

Механизм выглядит следующим образом:

Транспозоны несут потенциальные TFBS: В последовательности многих транспозонов содержатся короткие мотивы ДНК, которые могут служить сайтами связывания для определенных клеточных TFs. Откуда они там? Иногда это функциональные сайты, нужные для регуляции экспрессии самого транспозона (особенно у LTR-элементов). В других случаях они могут возникать случайно или быть "захваченными" из генома хозяина в процессе мобилизации. Независимо от происхождения, они становятся "мобильными" TFBS.
Амплификация и дисперсия: Когда семейство транспозонов активно размножается, оно "разбрасывает" сотни или тысячи копий этих потенциальных TFBS по всему геному, часто вблизи различных генов хозяина.
Кооптация TFBS: Со временем, под действием мутаций и естественного отбора, некоторые из этих разбросанных сайтов могут стать функциональными. Это означает, что последовательность сайта становится оптимальной для связывания TF, хроматин вокруг становится доступным, и сайт оказывается на правильном расстоянии от промотора. Сколько времени это занимает? Это очень вариабельный эволюционный процесс, зависящий от скорости мутаций, доступности хроматина и силы отбора. Формирование отдельных новых регуляторных связей может происходить относительно быстро (тысячи или десятки тысяч лет), в то время как перестройка целых сетей – это, как правило, результат накопления изменений на протяжении миллионов лет.
Формирование новых регуляторных связей: Когда такой "одомашненный" TFBS становится активным, ген хозяина рядом с ним попадает под контроль соответствующего TF. Если один и тот же TF связывается с аналогичными сайтами от одного семейства ТЭ рядом с разными генами, то все эти гены оказываются под координированным контролем. Но как из случайных событий возникает координация? Изначально "подключение" гена к новому TF через ТЭ-сайт случайно и может быть вредным или нейтральным. Однако, если по счастливой случайности координированная регуляция группы генов дает организму преимущество в определенных условиях, то естественный отбор будет "подхватывать" и закреплять именно эту конфигурацию сети, отсеивая неудачные варианты. Так полезная координация "вырастает" из случайной изменчивости под действием отбора.

Таким образом, амплификация одного семейства транспозонов может быстро создать основу для новой регуляторной каскады. Этот механизм особенно важен для создания видоспецифичных регуляторных отличий [19]. Почему именно ТЭ так важны для этого? Потому что история "вторжений" и "взрывов" активности разных семейств ТЭ уникальна для каждой эволюционной линии. Разные виды получают разный "набор" мобильных регуляторных элементов, разбросанных по геному. Последующее "одомашнивание" этих видоспецифичных элементов и создает уникальные для каждого вида генные сети, в то время как другие механизмы мутаций обычно вносят более локальные изменения.

Помимо TFBS, транспозоны могут распространять и другие регуляторные модули – промоторы, энхансеры, сайленсеры, инсуляторы (особенно богаты ими LTR ретротранспозонов). Их кооптация также вносит вклад в перестройку GRNs.

Способность транспозонов действовать как "мобильные регуляторные кассеты", распространяющие TFBS и другие регуляторные элементы, делает их мощнейшим инструментом эволюции генных сетей. Это позволяет не только изменять работу отдельных генов, но и создавать новые сложные паттерны координированной экспрессии, лежащие в основе развития, адаптации и возникновения разнообразия.

6.4. Генерация новых генов и функций: роль в перетасовке экзонов (exon shuffling)

Помимо влияния на регуляцию существующих генов, мобильные элементы играют важную роль и в создании новых генов или новых вариантов белков с измененными функциями. Один из ключевых механизмов этого процесса – "перетасовка экзонов" (exon shuffling).

Напомним, что гены эукариот имеют экзон-интронную структуру. Экзоны несут кодирующую информацию, а интроны вырезаются. Экзоны часто соответствуют определенным функциональным доменам белка. "Перетасовка экзонов" – это эволюционный процесс, при котором экзоны из разных генов рекомбинируются, создавая новые гены с новыми комбинациями доменов.

Как транспозоны способствуют этому процессу?

Рекомбинация между ТЭ в интронах: Интроны эукариот часто длинные и насыщены транспозонами. Почему важны именно интроны? Длинные интроны служат "буфером", позволяя рекомбинации происходить между экзонами, не разрушая кодирующие последовательности. Они также насыщены ТЭ, предоставляя сайты для NAHR. У организмов без интронов (как у большинства бактерий) этот механизм практически невозможен или редок. Если NAHR происходит между ТЭ в интронах разных генов, это может привести к перестройкам, которые физически переносят экзон(ы) из одного гена в другой.
Экзонизация транспозонов: Фрагменты транспозонов могут быть включены в мРНК из-за криптических сайтов сплайсинга. Что именно добавляют эти фрагменты? Часто это короткие последовательности, но иногда могут экзонизироваться и фрагменты, кодирующие части белков транспозона. Со временем даже изначально "бессмысленные" вставки могут эволюционировать.
Образование гибридных генов: Перестройки из-за ТЭ могут приводить к слиянию двух ранее независимых генов.
Захват генных фрагментов (Helitrons): Helitrons могут "прихватывать" экзоны или части генов и переносить их в новые места [81].

Насколько высока вероятность, что в результате "перетасовки" или слияния получится работающий и полезный белок? Изначально – невелика. Большинство таких случайных комбинаций будут нефункциональны. Однако сам факт постоянной генерации таких новых комбинаций транспозонами увеличивает шанс на то, что рано или поздно возникнет удачный вариант, который будет подхвачен эволюцией.

Все эти механизмы значительно ускоряют процесс эволюции белков. Вместо того чтобы полагаться только на медленное накопление точечных мутаций, ТЭ позволяют быстро комбинировать уже существующие функциональные блоки. Насколько это быстрее "обычной" эволюции генов? Считается, что "перетасовка" готовых модулей (экзонов) с помощью ТЭ может приводить к появлению белков с принципиально новыми архитектурами значительно быстрее, чем постепенное накопление точечных мутаций в дуплицированной копии гена. Хотя оба процесса важны, ТЭ-опосредованное shuffling обеспечивает путь для более скачкообразных инноваций в белковом мире. Это считается одним из важнейших факторов возникновения белкового разнообразия и эволюции сложности у эукариот.

6.5. Транспозоны и видообразование

Помимо влияния на структуру и функцию генов отдельных особей, активность мобильных генетических элементов может играть существенную роль и на более высоком уровне – в процессе видообразования. Ключевым этапом видообразования является формирование репродуктивной изоляции между популяциями. Транспозоны могут способствовать возникновению таких барьеров несколькими путями, в основном через механизмы пост-зиготической изоляции.

Гибридный дисгенез: Классический пример – система P-элементов у дрозофилы. Если самцы из линии с P-элементами скрещиваются с самками из линии без них, то в зародышевой линии гибридов происходит массовая мобилизация P-элементов, вызывая мутации и стерильность. Почему важна именно "бесэлементная" мать? Ключевые факторы подавления транспозонов – малые piРНК и белки PIWI – накапливаются в цитоплазме яйцеклетки. Сперматозоид же почти не несет цитоплазмы. Поэтому, если мать из "защищенной" линии, ее яйцеклетка содержит piРНК, способные сразу подавить P-элементы отца. Если же мать из "наивной" линии, ее цитоплазма "безоружна", что и приводит к активации ТЭ у гибридов. Такая несовместимость эффективно изолирует линии [82].
Хромосомные перестройки: Рекомбинация между копиями ТЭ может приводить к инверсиям и транслокациям. Если в разных популяциях закрепляются разные перестройки, то гибриды будут гетерозиготны по ним. Это часто приводит к проблемам в мейозе, образованию несбалансированных гамет и снижению фертильности гибридов [53]. Сколько перестроек для этого нужно? Даже одна крупная инверсия или транслокация может существенно снизить фертильность гибридов и создать сильный барьер для обмена генами. Накопление нескольких независимых перестроек делает этот барьер практически непреодолимым. Транспозоны предоставляют "горячие точки" для возникновения таких изолирующих перестроек.
Генетические несовместимости (модель Добжанского-Мюллера): Транспозоны и гены их контроля могут быть вовлечены в несовместимости. Мутация в гене защиты в одной популяции и мутация в ТЭ (делающая его устойчивым) в другой могут быть безвредны по отдельности, но их комбинация у гибрида может привести к неконтролируемой активности ТЭ и снижению жизнеспособности [83].
Общая генетическая дивергенция: Различная активность и накопление ТЭ в изолированных популяциях вносят вклад в их общую генетическую дивергенцию.

Могут ли ТЭ быть главной причиной видообразования? Обычно видообразование – сложный процесс, включающий географию, экологию, отбор. Транспозоны редко действуют в одиночку. Однако они могут быть мощными катализаторами, значительно ускоряя формирование репродуктивной изоляции (через дисгенез или перестройки) между уже частично разошедшимися популяциями, иногда играя решающую роль в завершении процесса. Обратим ли этот процесс? Если репродуктивная изоляция уже возникла из-за сложных перестроек или накопленных генетических несовместимостей (даже если исходные ТЭ инактивируются), возврат к полной совместимости и слиянию видов считается крайне маловероятным в природных условиях.

Таким образом, мобильные генетические элементы могут выступать в роли катализаторов репродуктивной изоляции и играть активную роль в процессе дивергенции популяций и образовании новых видов.

6.6. Горизонтальный перенос транспозонов между видами

Обычно генетическая информация передается вертикально – от родителей к потомкам. Однако существует и горизонтальный перенос генов (HGT) – передача генетического материала между разными организмами, не связанными прямым родством. Мобильные генетические элементы являются одними из наиболее "успешных" последовательностей ДНК, способных к HGT, в том числе и между эукариотическими видами. Насколько часто это происходит? Хотя отдельное событие HGT может быть редким, накопленные данные показывают, что это происходило многократно для разных семейств ТЭ на протяжении эукариотической эволюции. Это существенный фактор, объясняющий распространение и персистенцию многих ТЭ семейств.

Доказательства HGT транспозонов включают:

Несоответствие филогении: Эволюционное древо ТЭ не совпадает с древом хозяев.
Высокое сходство последовательностей: Копии ТЭ у далеких видов слишком похожи для вертикальной передачи.
"Пятнистое" распространение: Наличие ТЭ у несвязанных видов внутри большой группы [70].

Каким образом транспозоны могут преодолевать межвидовые барьеры? Точные механизмы HGT часто остаются гипотетическими, но предполагается участие векторов:

Вирусы: Могут случайно захватывать ДНК хозяина с ТЭ.
Паразиты и симбионты: Организмы с тесным контактом (внутриклеточные паразиты/симбионты, паразитоиды) могут служить "мостами".
Прямой контакт / ДНК из среды: Менее вероятно для сложных эукариот. Но какова вероятность попадания именно в зародышевые клетки? Вероятность одного успешного переноса с интеграцией в зародышевую линию действительно мала, так как требует цепочки удачных событий. Однако на эволюционных масштабах времени, с учетом огромного числа особей и взаимодействий, даже низковероятные события происходят достаточно часто, чтобы быть эволюционно релевантными.

Каково эволюционное значение HGT транспозонов?

"Бегство" от защиты хозяина: Позволяет колонизировать "наивные" геномы без специфических механизмов подавления. Что происходит дальше? Попадание активного ТЭ в такой геном часто вызывает "вспышку" транспозиций. Это может быть периодом геномной нестабильности. Однако со временем включается коэволюция: хозяин вырабатывает защиту, и отбор благоприятствует особям, лучше контролирующим "пришельца", приводя к новому равновесию.
Источник генетической новизны: Перенесенный ТЭ может вызывать мутации, перестройки, стать материалом для экзаптации.
Ускорение геномной эволюции: HGT может приводить к быстрым изменениям в геномах.

Классическим примером транспозона, известного склонностью к HGT, является элемент Mariner [84]. Почему именно он так успешен? Предполагается, что этому способствуют его относительно простой механизм "вырезать-вставить", не требующий сложных клеточных кофакторов, невысокие требования к сайту вставки (часто просто TA) и способность транспозазы работать в клетках разных организмов.

Таким образом, горизонтальный перенос является важной частью биологии мобильных элементов, позволяя им преодолевать видовые барьеры, колонизировать новые геномы и играть роль в масштабных эволюционных процессах.

6.7. Жизненный цикл транспозона в геноме: от активности к деградации

Присутствие мобильных элементов в геноме – это не статичная картина. Каждое семейство транспозонов проходит свой эволюционный "жизненный цикл" внутри генома хозяина. Понимание этого цикла помогает осознать, почему геномы часто выглядят как "слоеный пирог" или "кладбище" транспозонов разного возраста. Сколько времени занимает такой цикл? Это сильно зависит от типа ТЭ и хозяина, но обычно речь идет об эволюционных масштабах времени: активная фаза может длиться сотни тысяч или миллионы лет, а последующее "угасание" и деградация – десятки и сотни миллионов лет.

Типичный цикл можно разделить на стадии:

Вторжение и/или амплификация: Цикл часто начинается с попадания активного ТЭ в "наивный" геном (HGT) или с реактивации молчавшего элемента. В этот период ТЭ может быстро размножаться, вызывая высокую мутагенную активность.
Установление контроля хозяином: В ответ геном хозяина активирует защитные механизмы (РНКi, эпигенетика). Активность ТЭ резко снижается, достигается динамическое равновесие.
Накопление мутаций и инактивация: Копии ТЭ накапливают случайные мутации, а ошибки транспозиции создают дефектные копии. Большинство копий становятся неавтономными или "мертвыми" ("молекулярными ископаемыми"). Могут ли "мертвые" ТЭ "воскреснуть"? Полностью инактивированные копии с разрушенными генами – нет. Но элементы, "заглушенные" эпигенетически, могут реактивироваться при определенных условиях (стресс, мутации в защитных системах). Также неавтономный элемент "оживет", если в геном попадет совместимый с ним активный автономный "помощник".
Деградация и элиминация: Неактивные копии продолжают накапливать мутации, их последовательности "расплываются". Как же их тогда опознают? Ученые используют биоинформатические методы, которые ищут характерные "остатки" – фрагменты LTR или TIR, консервативные участки генов транспозазы/RT, TSD, или просто анализируют повторяемость последовательности. Чем старше элемент, тем сложнее его идентифицировать. Кроме того, ТЭ могут физически удаляться из генома за счет делеций. Но если есть удаление, почему ТЭ так много? В большинстве крупных геномов, как у человека, скорость накопления ТЭ (особенно ретротранспозонов) исторически превышала скорость их удаления. Механизмы делеции часто оказываются недостаточно эффективными, чтобы компенсировать "взрывы" амплификации, что приводит к накоплению огромного числа "ископаемых" остатков [85].

Этот цикл может повторяться с новыми ТЭ, создавая сложную мозаику из активных, неактивных и деградировавших остатков разных семейств и возрастов, отражающую историю взаимодействия мобильных элементов и генома хозяина.

Глава 7: Транспозоны и здоровье: вклад в болезни и старение

7.1. Наследственные заболевания, вызванные инсерциями транспозонов

Помимо своей фундаментальной роли в эволюции и архитектуре генома, мобильные генетические элементы могут оказывать и прямое, порой разрушительное, влияние на здоровье человека. Один из наиболее очевидных путей такого влияния – это возникновение наследственных (менделевских) заболеваний в результате инсерционного мутагенеза, вызванного транспозонами.

Механизм здесь достаточно прямолинеен: если активный транспозон перемещается и встраивается в новый участок ДНК внутри зародышевой клетки (сперматозоида или яйцеклетки) или на самых ранних стадиях развития эмбриона, то эта мутация будет присутствовать во всех (или почти всех) клетках развившегося организма. Почему важна именно зародышевая линия? Только мутации, произошедшие в клетках, дающих начало сперматозоидам или яйцеклеткам (или в самом оплодотворенном яйце), могут быть переданы по наследству следующему поколению. Если вставка транспозона произойдет позже, например, в клетке кожи или печени взрослого человека (соматическая мутация), она затронет только этого индивида и не перейдет к его детям. Если вставка в зародышевой линии произошла внутри или рядом с жизненно важным геном и нарушила его функцию, это может привести к развитию генетического заболевания, передаваемого по наследству.

Кто же является "виновником" таких событий в геноме человека? Учитывая, что большинство ДНК-транспозонов и ERV в нашем геноме неактивны, основную роль играют:

LINE-1 (L1): Единственный автономный и все еще активный класс транспозонов у человека.
Alu и SVA элементы: Неавтономные, перемещаются с помощью белков L1. Почему именно они активны? LINE-1, вероятно, обладают более "живучим" механизмом и лучше уклоняются от защиты хозяина, чем вымершие ДНК-транспозоны или большинство ERV. Alu и SVA процветают, эффективно используя машину L1.

Чаще всего вставка транспозона в ген приводит к потере его функции, что и лежит в основе заболевания. Известно уже довольно много примеров наследственных заболеваний человека, причиной которых является вставка мобильного элемента:

Гемофилия А и B (LINE-1 или Alu в гены F8/F9).
Нейрофиброматоз типа 1 (NF1) (Alu в ген NF1).
Мышечная дистрофия Дюшенна (DMD) (Alu/L1 в ген DMD).
Муковисцидоз (Редкие Alu в CFTR).
Наследственная предрасположенность к раку (Редкие L1/Alu в APC/BRCA2). Почему в примерах часто фигурируют большие гены? Вероятно, это связано как с бОльшей вероятностью случайного попадания в крупную мишень, так и с тем, что мутации в таких генах чаще приводят к заметным клиническим последствиям, из-за чего их лучше выявляют.

Насколько часто возникают такие заболевания? Новые (de novo) вставки мобильных элементов, приводящие к наследственным болезням, считаются относительно редкими событиями (возможно, ~1 на 500-1000 новых мутаций при моногенных болезнях). Но почему так редко, если есть активные L1? Это яркое свидетельство высокой эффективности систем защиты генома. Эпигенетический сайленсинг, РНК-интерференция (особенно piРНК в зародышевой линии) и факторы рестрикции большую часть времени успешно подавляют активность L1 и мобилизацию Alu/SVA. Наследственные болезни возникают лишь в тех редких случаях, когда транспозону удается "проскользнуть" сквозь все барьеры и неудачно встроиться в важный ген именно в зародышевой линии [86]. Тем не менее, это означает, что транспозоны являются постоянным источником наследственной патологии у человека. Такие инсерции обычно можно обнаружить с помощью современных методов генетического анализа.

7.2. Соматический мутагенез и геномная нестабильность

Мы обсудили, как вставки транспозонов в зародышевой линии приводят к наследственным заболеваниям. Однако активность мобильных элементов не ограничивается только клетками, передающими генетическую информацию потомству. Транспозоны, в первую очередь LINE-1 (L1) и зависимые от него Alu/SVA, могут перемещаться и в соматических клетках – клетках, формирующих ткани и органы нашего тела. Эта соматическая транспозиция происходит на протяжении всей жизни человека.

Поскольку соматические мутации не передаются по наследству, каждая новая вставка транспозона в соматической клетке затрагивает только саму эту клетку и ее потомков. Это приводит к генетическому мозаицизму: разные клетки одного и того же человека несут разный набор соматических инсерций ТЭ. Насколько велики эти различия? Количество новых вставок в каждой отдельной клетке за жизнь может быть невелико, но учитывая триллионы клеток в организме, каждый человек представляет собой уникальную мозаику соматических инсерций. В некоторых тканях, например, в мозге, где L1 активны в ходе развития, степень мозаицизма между нейронами может быть весьма значительной [87], хотя ее функциональные последствия еще только изучаются. Хотя активность ТЭ в большинстве соматических тканей обычно низка, она не равна нулю и может повышаться в определенных условиях.

Каковы последствия соматической мобильности транспозонов?

Геномная нестабильность: Каждая новая вставка – мутация. Кроме того, сама активность L1 (его эндонуклеазы) может вызывать разрывы ДНК. Накопление таких мутаций и разрывов со временем вносит вклад в общую геномную нестабильность.
Рак: Вклад ТЭ в развитие рака может быть двояким. Так L1 – причина или следствие рака? По-видимому, и то, и другое. Доказано, что новые вставки L1/Alu могут выступать как первичные драйверные мутации, "ломая" гены-супрессоры опухолей (например, APC, PTEN). С другой стороны, в уже развивающейся опухоли часто нарушается общая эпигенетическая регуляция, что приводит к вторичной реактивации многих ТЭ. Эта реактивация, в свою очередь, подливает масла в огонь, усиливая геномную нестабильность и помогая опухоли эволюционировать [88].
Старение: Существует гипотеза, связывающая активность ТЭ со старением. Насколько эта связь доказана? Это все еще активно исследуемая гипотеза. Есть данные о повышении экспрессии ТЭ и накоплении их соматических вставок в стареющих тканях (например, в мозге). Существуют и правдоподобные механизмы (ТЭ-индуцированное повреждение ДНК, хроническое воспаление) [89]. Однако прямых доказательств причинно-следственной связи пока недостаточно. Возможно, активация ТЭ – это скорее следствие, чем причина возрастных изменений.
Неврологические и психические расстройства?: Особый интерес представляет активность L1 в нейронах – долгоживущих клетках, создающих мозаицизм генома мозга. Почему L1 активны именно там? Точного ответа нет. Возможно, нейроны более уязвимы или имеют менее эффективные механизмы подавления. Нельзя исключить и спекулятивную гипотезу о том, что мозаицизм может вносить вклад в пластичность мозга. Однако пока более вероятным кажется, что это либо "побочный эффект", либо даже фактор риска некоторых заболеваний. Ведутся исследования возможной связи нейронального мозаицизма с риском неврологических или психических расстройств.

Эффективность контроля над соматической активностью ТЭ может варьировать между тканями и снижаться с возрастом или при патологиях. Таким образом, соматическая мобильность транспозонов является постоянным источником мутаций и геномной нестабильности, который вносит свой вклад в развитие таких сложных процессов, как онкогенез и, возможно, старение.

7.3. Воспалительные и аутоиммунные реакции, связанные с транспозонами

Помимо прямого мутагенного действия, мобильные генетические элементы могут влиять на здоровье опосредованно – провоцируя нежелательные воспалительные и аутоиммунные реакции. Это связано со способностью врожденной иммунной системы распознавать чужеродные или неуместно расположенные нуклеиновые кислоты как сигнал опасности. В клетке существуют специальные белки-сенсоры: TLRs (Toll-like receptors), RLRs (RIG-I-like receptors), cGAS-STING путь и другие. Что именно они узнают в продуктах ТЭ? В первую очередь, неправильную локализацию (ДНК в цитоплазме) или аномальную структуру (длинные двуцепочечные РНК, РНК:ДНК гибриды), которые имитируют сигналы вирусной инфекции (PAMPs - Pathogen-Associated Molecular Patterns) или клеточного повреждения (DAMPs - Damage-Associated Molecular Patterns). Активация этих сенсоров приводит к продукции интерферонов I типа (IFN-I) и других провоспалительных молекул [90]. Зачем запускать воспаление на "свои" молекулы? Система врожденного иммунитета "настроена" на распознавание сигналов опасности. Нуклеиновые кислоты ТЭ в неправильном месте или форме имитируют эти сигналы, заставляя клетку думать, что она атакована вирусом или повреждена. Запускаемое воспаление – это стандартный защитный ответ, который становится хроническим и вредным, если внутренний триггер постоянно присутствует.

Как транспозоны могут генерировать такие триггеры?

Цитоплазматическая ДНК ТЭ: Неудачная ретротранспозиция может привести к накоплению кДНК в цитоплазме, активируя cGAS-STING.
дцРНК ТЭ: Транскрипция ТЭ может создавать дцРНК, активируя TLR3/RLR.
РНК:ДНК гибриды: Могут распознаваться специфическими сенсорами.

В норме системы контроля и утилизации нуклеиновых кислот (ферменты TREX1, RNase H2) удаляют эти "опасные" молекулы. Однако при сбоях может происходить их накопление, приводящее к хронической активации врожденного иммунитета. Это лежит в основе некоторых аутовоспалительных и аутоиммунных заболеваний:

Интерферонопатии I типа (напр., синдром Айкарди-Гутьерес - AGS): Характеризуются хронической гиперпродукцией IFN-I. Причиной часто являются мутации в генах TREX1 или RNase H2. Что именно накапливается? При дефектах TREX1 в цитоплазме скапливаются фрагменты ДНК (включая кДНК ТЭ, особенно Alu). При дефектах RNase H2 накапливаются РНК:ДНК гибриды и рибонуклеотиды в ДНК. И те, и другие молекулы распознаются как "опасность".
Системная красная волчанка (СКВ): Наблюдается повышенный уровень IFN-I и аномальная экспрессия ТЭ. Предполагается, что нуклеиновые кислоты ТЭ вносят вклад в хроническую иммунную активацию [91].
Другие заболевания: Изучается роль ТЭ в патогенезе ревматоидного артрита, рассеянного склероза и др.

Можно ли это лечить, блокируя сенсоры? Разрабатываются такие лекарства (ингибиторы STING, JAK-киназ). Однако здесь есть риск: полное отключение этих фундаментальных защитных путей может сделать организм более уязвимым к реальным вирусным инфекциям. Поэтому поиск безопасных терапевтических стратегий продолжается.

Кроме того, хроническое низкоуровневое воспаление при старении ("inflammaging") также может быть частично связано с возрастным ослаблением контроля над ТЭ и постоянной слабой стимуляцией сенсоров врожденного иммунитета их продуктами.

Таким образом, транспозоны могут выступать как эндогенные триггеры воспалительных и аутоиммунных реакций. Нарушение баланса между активностью ТЭ и системами контроля/утилизации может приводить к развитию серьезных патологий.

7.4. Перспективы терапевтического воздействия на транспозоны?

Учитывая связь мобильных элементов с рядом заболеваний, возникает вопрос: можно ли разработать терапию, направленную на транспозоны? Идея заманчивая, но ее реализация сложна.

Потенциальные стратегии:

Прямое ингибирование мобильности ТЭ:

Ингибиторы ферментов: Разработка молекул, блокирующих RT и эндонуклеазу L1, интегразы LTR-элементов или транспозазы. Аналогично антиретровирусной терапии. Можно ли использовать существующие лекарства от ВИЧ (ингибиторы RT) против L1? Хотя RT LINE-1 и ВИЧ имеют общее происхождение, они достаточно различаются. Существующие анти-ВИЧ препараты показывают лишь ограниченную и неспецифическую активность против L1 in vitro, и их прямое перепрофилирование пока не привело к успеху, хотя исследования продолжаются.
Воздействие на нуклеиновые кислоты: Использование антисмысловых олигонуклеотидов или siRNA для разрушения мРНК транспозонов.

Усиление защитных систем хозяина:

Эпигенетическая терапия: Использование препаратов, усиливающих сайленсинг ТЭ. Но не опасно ли это? Да, общие эпигенетические препараты с низкой специфичностью несут высокий риск "заглушить" и нужные гены хозяина, вызывая серьезные побочные эффекты. Такие подходы требуют очень тонкой "настройки".
Терапия на основе РНКi: Доставка специфических малых РНК.

Борьба с последствиями активности ТЭ:

Усиление клиренса нуклеиновых кислот: Генная терапия при дефектах TREX1/RNase H2 (как при АГС).
Блокирование иммунных сенсоров/сигналов: Ингибиторы cGAS-STING, TLRs, JAK-киназ при ТЭ-ассоциированном воспалении/аутоиммунитете [92].

Проблемы и трудности:

Специфичность: Как нацелиться только на активные вредные ТЭ, не затронув неактивные копии или полезные гены/белки хозяина (ту же теломеразу)? Это главная проблема. Возможные пути – поиск уникальных особенностей активных ТЭ или разработка сверхспецифичных ингибиторов, но это чрезвычайно сложно.
Доставка: Эффективная и безопасная доставка терапевтических агентов.
Токсичность/Побочные эффекты: Вмешательство в фундаментальные процессы (репликация, репарация, иммунитет) несет риски (например, иммуносупрессия при блокаде сенсоров).

Текущий статус: На сегодняшний день (Май 2025 г.) прямая анти-транспозонная терапия у человека не применяется и находится на стадии исследований. Используются лишь некоторые препараты, воздействующие на пути, активируемые ТЭ (например, JAK-ингибиторы) [93]. Каковы же реальные перспективы? Учитывая огромные сложности, появление широко применяемых лекарств, целенаправленно действующих на сами транспозоны, в ближайшие 10-20 лет представляется маловероятным. Это скорее долгосрочная цель.

В заключение, хотя таргетирование мобильных элементов открывает интригующие терапевтические перспективы, предстоит решить множество фундаментальных проблем, прежде чем они смогут войти в клиническую практику.

8.1. Транспозонный мутагенез: поиск функций генов

Помимо их фундаментальной роли в эволюции, уникальные свойства мобильных элементов были взяты на вооружение учеными. Транспозоны стали мощными инструментами для изучения функций генов, особенно в рамках прямой генетики (поиск гена по фенотипу, в отличие от обратной генетики – изучение фенотипа при изменении известного гена).

Транспозоны идеальны для этого, так как их вставка одновременно вызывает мутацию и "метит" поврежденный ген известной последовательностью ДНК.

Типичная схема транспозонного мутагенеза:

Создание системы: В организм вводят транспозон и ген транспозазы. Используют как природные (P-элементы, Ac/Ds), так и искусственные (Sleeping Beauty, PiggyBac) системы [95]. Часто ген транспозазы находится под контролем индуцибельного промотора. Как это позволяет контролировать "прыжки"? Ученые активируют промотор (например, теплом или химическим веществом) только на короткое время или в определенных клетках, чтобы вызвать транспозицию. Затем источник транспозазы "выключают" или удаляют генетически, чтобы новые вставки стали стабильными.
Индукция транспозиции: Активируют транспозазу, заставляя транспозон встраиваться в геном.
Скрининг мутантов: Анализируют потомство на предмет появления интересующих мутантных фенотипов.
Идентификация гена: У мутантов определяют, куда встроился транспозон. Насколько случайны эти вставки? Идеально случайных не бывает. Большинство систем имеют свои "предпочтения" или "слепые зоны" (insertion bias), связанные с последовательностью или структурой хроматина. Это нужно учитывать при планировании эксперимента. Как знание ТЭ помогает найти ген? Зная точную последовательность концов транспозона, можно создать праймеры для ПЦР. Методы вроде инвертированной ПЦР позволяют амплифицировать именно тот участок ДНК хозяина, который находится рядом с известным концом транспозона. Секвенирование этого фрагмента показывает, в какой ген попал ТЭ [94].
Заключение: Найденный ген – кандидат на роль гена, отвечающего за признак.

Преимущества: непредвзятый поиск генов; молекулярная метка упрощает идентификацию.

Вариации: "Ловушки энхансеров" (enhancer trapping) или "ловушки генов" (gene trapping). Как они работают? Используют транспозоны с репортерным геном (GFP, LacZ) и слабым базовым промотором. Если транспозон встраивается рядом с активным энхансером гена хозяина, энхансер "дотягивается" до слабого промотора в транспозоне и активирует репортер. "Свечение" репортера показывает, где и когда работает энхансер хозяина [96].

Несмотря на ограничения (неслучайность вставок, возможные перестройки), транспозонный мутагенез – важнейший метод функциональной геномики.

8.2. Системы транспозонов для генетической трансформации (создание ГМО)

Помимо использования транспозонов для "выключения" генов, ученые научились применять их для вставки и стабильной экспрессии нужных генов (трансгенов), то есть для генетической трансформации.

Принцип транспозон-опосредованной трансгенеза:

Создание транспозонного вектора: Берут ДНК-транспозонную систему. Вместо гена транспозазы между концевыми повторами (TIRs) вставляют целевой ген (трансген) и часто селективный маркер. Получается кассета: [TIR] – [Трансген + Маркер] – [TIR].
Доставка компонентов в клетку: Эту векторную ДНК вводят в клетки-мишени вместе с временным источником активной транспозазы, соответствующей данным TIRs. Важно, что источник транспозазы предоставляется временно. Как это достигается? Чаще всего используют отдельную плазмиду, несущую ген транспозазы, которая не встраивается в геном и со временем теряется при делениях клетки. Другой метод – введение готовой мРНК транспозазы, которая обеспечивает синтез фермента лишь на короткое время до своей деградации. Главное – избежать стабильной интеграции самого гена транспозазы.
Транспозиция трансгена: Внутри клетки синтезируется транспозаза. Она распознает TIRs на векторе, вырезает всю кассету [TIR-трансген-TIR] и встраивает ее в участок генома клетки-хозяина. Можно ли выбрать это место? К сожалению, для большинства используемых систем (SB, PB, Tol2) интеграция происходит полуслучайно, с определенными предпочтениями (например, к активному хроматину), но без возможности точно указать сайт вставки. Это является основным недостатком и риском метода, так как случайная вставка может повредить важный ген хозяина (инсерционный мутагенез).
Стабильная интеграция: Поскольку источник транспозазы был временным, после интеграции транспозаза исчезает. Встроившийся трансген теряет способность "выпрыгивать" обратно – он становится стабильной частью генома [97]. Насколько это безопасно? Главный риск – инсерционный мутагенез из-за случайного места вставки. Риск того, что встроившаяся кассета начнет "прыгать" снова, считается низким, если источник транспозазы был действительно временным и в геноме нет "родственных" активных транспозаз. Однако сама вставка теоретически может повлиять на регуляцию соседних генов. Поэтому безопасность требует тщательной оценки.

Преимущества транспозонных систем:

Стабильная интеграция (в отличие от временной экспрессии).
Высокая эффективность для многих клеток/организмов.
Интеграция определенного фрагмента.
Контролируемая копийность (часто 1 или несколько копий).
Широкий круг хозяев (для искусственных систем Sleeping Beauty, PiggyBac, Tol2). Почему их несколько и как выбрать? Разные системы отличаются эффективностью в разных клетках, максимальным размером трансгена, профилем сайтов вставки и другими свойствами (например, PiggyBac может вырезаться почти без следа). Выбор зависит от задачи.

Благодаря этим преимуществам, транспозонные системы активно используются для создания трансгенных модельных животных, стабильных клеточных линий и в разработке подходов к генотерапии.

8.3. Генная терапия на основе транспозонов (Sleeping Beauty, PiggyBac systems)

Способность транспозонных систем эффективно и стабильно встраивать генетический материал в геном клетки открыла перспективы их использования в генной терапии – подходе, направленном на лечение заболеваний путем исправления или компенсации дефектных генов. Транспозоны рассматриваются как альтернатива вирусным векторам.

Основная идея – использование инженерных систем (таких как Sleeping Beauty или PiggyBac) для доставки функциональной копии гена. Процедура может проводиться двумя способами:

Ex vivo (вне организма): У пациента забирают клетки (например, стволовые клетки крови, Т-лимфоциты). В лаборатории в них вводят вектор [TIR-терапевтический ген-TIR] и временный источник транспозазы. Транспозаза встраивает ген в геном. Клетки отбирают, размножают и вводят обратно пациенту. Этот подход используется, например, для создания CAR-T клеток для иммунотерапии рака. Как это работает? В Т-клетки пациента с помощью транспозона вставляют ген, кодирующий химерный антигенный рецептор (CAR). Этот искусственный рецептор на поверхности Т-клетки узнает раковые клетки и активирует Т-клетку на их уничтожение.
In vivo (внутри организма): Компоненты доставляются непосредственно в целевые ткани пациента. Почему этот подход сложнее? Главные трудности in vivo – это эффективная и специфическая доставка обоих компонентов (ДНК транспозона и источника транспозазы) точно в нужные клетки организма, а также сложность контроля за процессом интеграции и отбора правильно модифицированных клеток внутри пациента.

Потенциальные преимущества транспозонных систем перед вирусными векторами:

Профиль интеграции: Исследования показывают, что SB и PB реже встраиваются у самых начал генов по сравнению с некоторыми вирусами, что потенциально снижает риск инсерционного онкогенеза. Насколько велика разница? Она существует, но поскольку интеграция все равно полуслучайна, риск полностью не исключен ни для одного интегрирующего вектора. Попытки "нацелить" транспозоны на безопасные участки пока экспериментальны.
Отсутствие вирусных компонентов: Исключает иммунный ответ против вирусных белков.
Большая емкость: Могут нести более крупные гены.
Простота и стоимость производства: Производство плазмид/мРНК потенциально проще и дешевле вирусных векторов.

Проблемы и вызовы:

Случайная интеграция: Риск инсерционного мутагенеза сохраняется.
Эффективность: Достижение высокой эффективности стабильной интеграции in vivo или в стволовых клетках остается сложной задачей.
Доставка in vivo: Главное препятствие для широкого применения.
Возможная иммуногенность: Белок транспозазы может вызвать иммунный ответ.

Текущее состояние: На сегодняшний день (Май 2025 г.) генная терапия на основе транспозонов активно развивается. Системы Sleeping Beauty и PiggyBac проходят клинические испытания, в первую очередь для ex vivo модификации Т-клеток (CAR-T) и гемопоэтических стволовых клеток. Насколько можно быть уверенным в долгосрочной стабильности? Сама вставка, сделанная с помощью временного источника транспозазы, считается очень стабильной. Основные долгосрочные риски связаны с последствиями изначальной вставки (не попал ли транспозон в плохой район генома?) и возможностью эпигенетического "замолкания" трансгена со временем [98].

В заключение, инженерные транспозонные системы представляют собой многообещающую невирусную платформу для генной терапии, но для их широкого клинического применения необходимо решение проблем контроля сайта интеграции, эффективности и доставки.

8.4. Другие применения: картирование, филогенетика, индукция перестроек

Возможности использования транспозонов как молекулярных инструментов не исчерпываются мутагенезом и трансгенезом.

Теггирование генов и картирование паттернов экспрессии: Системы "ловушек энхансеров/генов" с репортерными генами (GFP, LacZ) используются для глобального картирования регуляторных элементов и активных генов [96]. Зачем это нужно при наличии RNA-Seq? Ловушки дают пространственную и временную картину активности регуляторных элементов in vivo (где и когда светится GFP?), что дополняет данные RNA-Seq об общем уровне РНК. Они помогают найти сами регуляторные элементы и связать их с паттернами экспрессии, выступая как "молекулярные репортеры".
Геномное картирование и филогенетика: Исторически вставки ТЭ служили физическими маркерами на хромосомах. Кроме того, паттерн присутствия/отсутствия копий ТЭ в определенных локусах служит филогенетическим маркером. Как это работает? Метод основан на том, что встраивание ТЭ в конкретное место генома – редкое и обычно необратимое событие. Если два вида имеют одинаковую вставку ТЭ в одном и том же локусе, скорее всего, она произошла у их общего предка. Анализируя паттерны таких общих вставок у разных видов, можно построить их эволюционное древо [99].
Индукция хромосомных перестроек: Способность ДНК-транспозонов вызывать разрывы ДНК может быть использована для экспериментального создания делеций, инверсий или транслокаций в модельных организмах для изучения их последствий. Насколько точно это можно контролировать? Обычно нет. Исследователи могут повысить общую частоту перестроек, активировав ТЭ, но предсказать или вызвать конкретную перестройку между определенными копиями ТЭ с высокой точностью стандартными методами очень сложно. Это остается стохастическим процессом.
Попытки создания систем таргетированной интеграции: Одно из самых желанных направлений – встраивание транспозона в заранее заданное место генома. Ведутся исследования по созданию химерных транспозаз, слитых со специфическими ДНК-связывающими доменами (цинковыми пальцами, TALEN, dCas9) [100]. Почему это так трудно? Основная сложность – перенаправить весь комплекс транспосомы к нужной точке и заставить его сработать именно там, преодолев собственные механизмы выбора мишени транспозазой и обеспечив доступность целевого участка хроматина, при этом сохранив высокую эффективность интеграции и избежав нецелевых вставок.

Таким образом, мобильные генетические элементы предоставили исследователям универсальный и мощный набор инструментов для решения широкого круга задач – от фундаментального изучения генов до разработки новых биотехнологий.

Глава 9: Заключение: вездесущие и влиятельные элементы генома

9.1. Резюме: двойственная природа транспозонов (паразиты и двигатели эволюции)

Мы прошли долгий путь, изучая мир мобильных генетических элементов – транспозонов. Мы узнали, что это участки ДНК, способные перемещаться внутри генома, что они делятся на два больших класса, и что они составляют огромную часть геномов многих организмов. На протяжении этой книги мы видели транспозоны в разных ролях, и теперь можем подвести итог, подчеркнув их удивительно двойственную природу.

С одной стороны, транспозоны предстают перед нами как "эгоистичные" генетические элементы, или геномные "паразиты". Их основная "цель" – собственное размножение. Эта активность не проходит бесследно: они вызывают мутации, провоцируют хромосомные перестройки, несут метаболическую нагрузку, могут вызывать иммунные реакции и напрямую связаны с заболеваниями. Это заставляет геном хозяина вырабатывать сложные системы контроля.

Но с другой стороны, транспозоны – это мощнейшие двигатели эволюционных изменений:

Они – важнейший источник генетического разнообразия.
Они – главные архитекторы размера и структуры геномов.
Они играют ключевую роль в перестройке генных регуляторных сетей.
Они предоставляют "строительные блоки" для создания новых генов и функций.

Через процесс экзаптации ("одомашнивания") геном хозяина научился использовать их для выполнения критически важных функций. Перестают ли они быть "эгоистами"? С точки зрения выполняемой функции и действующих на них сил отбора – да, они становятся частью генома хозяина. Но их происхождение связано с механизмами эгоистичной репликации. Экзаптация – это "перепрофилирование" хозяином изначально эгоистичного элемента.

Таким образом, транспозоны одновременно являются и потенциальной угрозой, и незаменимым источником новизны. Что же перевешивает для человека сегодня? Оценить это сложно. Несомненно, "одомашненные" ТЭ прошлого фундаментально полезны. Вред от новых вставок реален, но его частота относительно низка благодаря защите. Возможно, основной "вклад" ТЭ сейчас – это поддержание генетического разнообразия и долгосрочной эволюционной пластичности, балансирующее на грани с риском патологий. Наше понимание их роли эволюционировало от "генетического мусора" до признания их глубокого и часто конструктивного влияния.

Эта двойственность и делает мир транспозонов таким сложным и увлекательным. Каково же их будущее в нашем геноме? Трудно сказать наверняка. Вероятно, существующие активные семейства будут и дальше находиться под давлением контроля, постепенно угасая. Но всегда есть вероятность вторжения новых ТЭ или реактивации старых. Полное исчезновение ТЭ маловероятно; скорее, будет продолжаться динамическая коэволюция. Почему же они оказались столь эволюционно успешны? Их успех основан на самой способности к самокопированию, разнообразии механизмов, способности ускользать от защиты и перемещаться между видами (HGT). Возможно, косвенно они даже повышают эволюционируемость своих хозяев, что способствует их совместному выживанию.

9.2. Транспозомы: транспозоны как интегральная часть геномной экосистемы

Рассмотрев множество аспектов биологии мобильных элементов, мы можем перейти к более целостному взгляду. Полезно представить всю совокупность мобильных элементов в геноме как единую динамическую систему, некий "транспозом", являющийся неотъемлемой частью общей экосистемы генома.

В этой метафорической экосистеме геном хозяина – среда обитания. "Коренные жители" – стабильные гены. Транспозоны – динамичные игроки: "интервенты", "колонизаторы", "конкуренты", иногда "симбионты" или "ресурсы". Есть ли среди них "ключевые виды"? Да, некоторые семейства ТЭ играют непропорционально большую роль. Например, активные LINE-1 элементы у млекопитающих, предоставляя "транспорт" для миллионов Alu и SVA, во многом определяют общую мобильность в геноме. Системы защиты генома – "экологический контроль".

Ключевой аспект – глубокая взаимосвязанность транспозонов и генома хозяина: ТЭ зависят от клеточной машины; хозяин активно реагирует на ТЭ (защита); ТЭ влияют на гены хозяина; они генерируют изменчивость; хозяин их "одомашнивает"; активность ТЭ зависит от состояния хозяина. Может ли геном хозяина активнее "управлять" ТЭ? Прямых доказательств целенаправленного "менеджмента" (кроме подавления и экзаптации) мало. В основном, взаимодействие сводится к конфликту и случайному использованию последствий активности ТЭ.

Состояние "транспозома" – это динамическое равновесие, определяемое балансом между размножением ТЭ, контролем хозяина, мутациями, удалением и HGT [101]. Может ли эта экосистема быть стабильной? Абсолютно статичной – нет, но геном достигает динамической стабильности: механизмы контроля сдерживают активность ТЭ в определенных границах, обеспечивая функционирование организма, несмотря на подспудные эволюционные изменения. Существует ли предел "замусоривания"? Хотя некоторые геномы содержат >80% ТЭ, вероятно, существует функциональный предел. Чрезмерная активность или количество ТЭ может нарушить работу генома, репликацию или создать непосильную нагрузку. Естественный отбор действует против особей, перешедших этот порог.

Осознание транспозонов как интегральной части геномной экосистемы кардинально изменило наши взгляды. Геном – это сложная, динамичная система, находящаяся в постоянной коэволюции со своими мобильными компонентами. Понимание законов функционирования этой экосистемы необходимо для полного понимания геномов и эволюции жизни. Дальнейшее изучение этой сложной системы, несомненно, принесет еще много открытий.

9.3. Открытые вопросы и будущие направления исследований

За десятилетия изучения мобильных элементов достигнут огромный прогресс. Однако мир транспозонов по-прежнему полон загадок.

Какие ключевые вопросы остаются открытыми?

Точные молекулярные механизмы некоторых путей транспозиции.
Нюансы регуляции: Как инициируется сайленсинг новых ТЭ? Как контролируется тканеспецифичность? Как ТЭ избегают контроля?
Взаимодействие с факторами хозяина: Полный спектр белков, влияющих на ТЭ.
Масштабы и механизмы экзаптации: Насколько часто? Каковы пути? Сколько непризнанных "одомашненных" ТЭ?
Механизмы HGT между эукариотами.
Последствия соматической мобильности для старения и болезней.
Эколого-эволюционная динамика в популяциях.
Глубокие эволюционные истоки ТЭ и их связь с вирусами. Какие из этих вопросов самые "горячие"? Трудно выделить один, но огромное внимание сейчас уделяется расшифровке роли ТЭ в регуляции генов и формировании сложных признаков, пониманию механизмов эпигенетического контроля и его сбоев, а также оценке вклада соматической мобильности в развитие и патологии.

Ответы на эти вопросы будут получены благодаря новым технологиям:

Геномика и биоинформатика: Секвенирование длинных прочтений, улучшенные алгоритмы аннотации ТЭ. Сколько же таких "неузнанных" остатков ТЭ? Точно оценить сложно, но вероятно, значительная часть некодирующей ДНК имеет древнее транспозонное происхождение. Даже сильно измененные, эти последовательности могут влиять на структуру хроматина. Анализ одиночных клеток для изучения соматического мозаицизма.
Функциональная геномика: Редактирование генома (CRISPR/Cas9) для изучения функций ТЭ и систем контроля. А можно ли с помощью CRISPR просто удалить все опасные ТЭ? Хотя это кажется логичным, такой подход нереалистичен и чрезвычайно опасен из-за огромного числа копий ТЭ, риска нецелевых разрезов, токсичности множественных разрывов ДНК и непредсказуемых последствий.
Эпигеномика и исследования хроматина: Методы ChIP-Seq, ATAC-Seq, Hi-C для изучения регуляции ТЭ.
Структурная биология: Определение 3D структур ферментов ТЭ.
Синтетическая биология: Инженерия ТЭ для биотехнологии и моделирования.

Возникают ли здесь этические вопросы? Безусловно. Как и любая мощная технология, работа с транспозонами, особенно их инженерия для генной терапии или модификации генома (особенно зародышевой линии), требует тщательной оценки безопасности, долгосрочных последствий и ответственного подхода, чтобы избежать непреднамеренного вреда или злоупотреблений.

Исследование транспозонов остается одной из самых динамичных областей биологии. Эти вездесущие и влиятельные элементы генома продолжают бросать вызов нашим представлениям, открывая новые горизонты в понимании эволюции, болезней и самой сути жизни. Изучение сложной "экосистемы генома", несомненно, будет оставаться в центре внимания биологов еще долгие годы.

Послесловие

Путь научного понимания мобильных генетических элементов – от взгляда на них как на "генетический мусор" до осознания их роли как ключевых игроков в жизни генома. Очевидно, транспозоны – это не просто случайные вставки, а неотъемлемая часть сложной генетической системы, влияющая на ее структуру, функцию и эволюцию.

Главный вывод – это признание генома не статичным кодом, а постоянно развивающейся, динамичной сущностью. Мобильные элементы являются одними из главных инструментов этой динамики. Их парадоксальная природа – постоянный баланс между риском разрушения и потенциалом для созидания новых генетических комбинаций и функций – лежит в основе многих эволюционных процессов.

Несмотря на значительный прогресс, мир транспозонов все еще хранит множество тайн. Как именно запускается и поддерживается контроль над ними? Каковы истинные масштабы их "одомашнивания" геномом? Какие долгосрочные последствия несет их активность в клетках нашего тела? Ответы на эти вопросы еще предстоит найти.

Изучение транспозонов предлагает более глубокий взгляд на саму эволюцию – на ее способность использовать даже изначально "эгоистичные" элементы для создания сложности и адаптации. Это напоминание о том, что генетическая информация пластична, а пути развития жизни непредсказуемы и изобретательны.

Мир мобильных генетических элементов сложен и динамичен. Дальнейшее исследование этого "внутреннего мира" генома, без сомнения, принесет еще немало открытий о том, как устроена жизнь на самом фундаментальном уровне.

Список использованной литературы

McClintock, B. (1950). The origin and behavior of mutable loci in maize. Proceedings of the National Academy of Sciences, 36(6), 344-355.
Fedoroff, N., Wessler, S., & Shure, M. (1983). Isolation of the transposable maize controlling elements Ac and Ds. Cell, 35(1), 235-242.
NobelPrize.org. The Nobel Prize in Physiology or Medicine 1983 - Barbara McClintock. https://www.nobelprize.org/prizes/medicine/1983/summary/
Feschotte, C., & Pritham, E. J. (2007). DNA transposons and the evolution of eukaryotic genomes. Annual review of genetics, 41, 331-368.
Werren, J. H. (2011). Selfish genetic elements. Cold Spring Harbor perspectives in biology, 3(10), a005159.
Wicker, T., et al. (2007). A unified classification system for eukaryotic transposable elements. Nature reviews genetics, 8(12), 973-982.
Kidwell, M. G. (2005). Transposable elements. In T. R. Gregory (Ed.), The evolution of the genome (pp. 165-221). Elsevier.
Siguier, P., et al. (2014). Insertion sequences and transposons in bacteria and archaea. Cold Spring Harbor perspectives in biology, 6(9), a010433.
Lander, E. S., et al. (2001). Initial sequencing and analysis of the human genome. Nature, 409(6822), 860-921.
Goffeau, A., et al. (1996). Life with 6000 genes. Science, 274(5287), 546-567.
Adams, M. D., et al. (2000). The genome sequence of Drosophila melanogaster. Science, 287(5461), 2185-2195.
Schnable, P. S., et al. (2009). The B73 maize genome: complexity, diversity, and dynamics. Science, 326(5956), 1112-1115.
Gregory, T. R. (2005). The C-value enigma. In T. R. Gregory (Ed.), The evolution of the genome (pp. 3-43). Elsevier.
Brouha, B., et al. (2003). Hot L1s account for the bulk of retrotransposition in the human population. Proceedings of the National Academy of Sciences, 100(9), 5280-5285.
Batzer, M. A., & Deininger, P. L. (2002). Alu repeats and human genomic diversity. Nature Reviews Genetics, 3(5), 370-379.
Doolittle, W. F., & Sapienza, C. (1980). Selfish genes, the phenotype paradigm and genome evolution. Nature, 284(5757), 601-603.
Orgel, L. E., & Crick, F. H. (1980). Selfish DNA: the ultimate parasite. Nature, 284(5757), 604-607.
Kazazian Jr, H. H. (2004). Mobile elements: drivers of genome evolution. Science, 303(5664), 1626-1632.
Feschotte, C. (2008). Transposable elements and the evolution of regulatory networks. Nature reviews genetics, 9(5), 397-405.
Kidwell, M. G., & Lisch, D. R. (2001). Perspective: transposable elements, parasitic DNA, and genome evolution. Evolution, 55(1), 1-24.
Slotkin, R. K., & Martienssen, R. (2007). Transposable elements and the epigenetic regulation of the genome. Nature reviews genetics, 8(4), 272-285.
Finnegan, D. J. (1989). Eukaryotic transposable elements and genome evolution. Trends in Genetics, 5, 103-107.
Havecker, E. R., Gao, X., & Voytas, D. F. (2004). The diversity of LTR retrotransposons. Genome biology, 5(6), 225.
Bannert, N., & Kurth, R. (2004). Retroelements and the human genome: new perspectives on an old relation. Proceedings of the National Academy of Sciences, 101(suppl_2), 14572-14579.
Richardson, S. R., et al. (2015). The influence of LINE-1 and SINE retrotransposons on mammalian genomes. Microbiology Spectrum, 3(2), MDNA3-0061-2014.
Kramerov, D. A., & Vassetzky, N. S. (2011). Origin and evolution of SINEs in eukaryotic genomes. Heredity, 107(6), 487-495.
Hua-Van, A., Le Rouzic, A., Boutin, T. S., Filée, J., & Capy, P. (2011). The struggle for life of the genome's most wealthy inhabitants: Class II transposons dynamics in eukaryote genomes. Genome Dynamics, 6, 68-84.
Hickman, A. B., & Dyda, F. (2015). Mechanisms of DNA Transposition. Microbiology Spectrum, 3(2), MDNA3-0034-2014.
Kapitonov, V. V., & Jurka, J. (2001). Rolling-circle transposons in eukaryotes. Proceedings of the National Academy of Sciences, 98(15), 8714-8719.
Kapitonov, V. V., & Jurka, J. (2006). Self-synthesizing DNA transposons in eukaryotes. Proceedings of the National Academy of Sciences, 103(12), 4540-4545.
Feschotte, C., Zhang, X., & Wessler, S. R. (2002). Miniature inverted-repeat transposable elements (MITEs) and their relationship with established DNA transposons. In N. L. Craig et al. (Eds.), Mobile DNA II (pp. 1147-1158). ASM Press.
Mahillon, J., & Chandler, M. (1998). Insertion sequences. Microbiology and molecular biology reviews, 62(3), 725-774.
Bennett, P. M. (2008). Plasmid encoded antibiotic resistance: acquisition and transfer of antibiotic resistance genes in bacteria. British journal of pharmacology, 153(S1), S347-S357.
Eickbush, T. H., & Malik, H. S. (2002). Origins and evolution of retrotransposons. In N. L. Craig et al. (Eds.), Mobile DNA II (pp. 1111-1144). ASM Press.
Wilhelm, M., & Wilhelm, F. X. (2001). Reverse transcription of retroviruses and LTR retrotransposons. Cellular and Molecular Life Sciences CMLS, 58(9), 1246-1262.
Lesbats, P., Engelman, A. N., & Cherepanov, P. (2016). Retroviral DNA integration mechanism. Annual review of virology, 3, 159-181.
Wlodawer, A., & Vondrasek, J. (1998). Inhibitors of HIV-1 protease: a major success of structure-assisted drug design. Annual review of biophysics and biomolecular structure, 27(1), 249-284.
Cost, G. J., et al. (2002). Human L1 element target-primed reverse transcription in vitro. The EMBO journal, 21(21), 5899-5910.
Beck, C. R., et al. (2011). LINE-1 elements in structural variation and disease. Annual review of genomics and human genetics, 12, 187-215.
Hickman, A. B., Chandler, M., & Dyda, F. (2001). Integrating roles for DNA transposases and retroviral integrases. Annual review of genetics, 35(1), 215-240.
Grindley, N. D. F. (2002). The movement of Tn3-like elements: transposition and cointegrate resolution. In N. L. Craig et al. (Eds.), Mobile DNA II (pp. 272-302). ASM Press.
Kapitonov, V. V., & Jurka, J. (2007). Helitrons on a roll: eukaryotic rolling-circle transposons. Trends in Genetics, 23(10), 521-529.
Curcio, M. J., & Derbyshire, K. M. (2003). The outs and ins of transposition: from Mu to kangaroo. Nature Reviews Molecular Cell Biology, 4(11), 865-877.
Sultana, T., et al. (2017). Integration site selection by eukaryotic retrotransposons. Nature Reviews Genetics, 18(4), 222-235.
Kazazian Jr, H. H., & Moran, J. V. (1998). The impact of L1 retrotransposons on the human genome. Nature genetics, 19(1), 19-24.
ReMine, S. K., et al. (2006). Functional aspects of the human LINE-1 promoter. Nucleic acids research, 34(2), 729-738.
Chuong, E. B., Elde, N. C., & Feschotte, C. (2017). Regulatory activities of transposable elements: from conflicts to benefits. Nature Reviews Genetics, 18(2), 71-86.
Belancio, V. P., Hedges, D. J., & Deininger, P. (2008). Mammalian non-LTR retrotransposons: for better or worse, in sickness and in health. Genome research, 18(3), 343-358.
Sorek, R., Ast, G., & Graur, D. (2002). Alu-containing exons are alternatively spliced. Genome research, 12(7), 1060-1067.
Stankiewicz, P., & Lupski, J. R. (2002). Genome architecture, rearrangements and genomic disorders. Trends in genetics, 18(2), 74-82.
Zhang, J. (2003). Evolution by gene duplication: an update. Trends in ecology & evolution, 18(6), 292-298.
Gardner, R. J. M., Sutherland, G. R., & Shaffer, L. G. (2012). Chromosome abnormalities and genetic counseling (4th ed.). Oxford University Press.
Rieseberg, L. H. (2001). Chromosomal rearrangements and speciation. Trends in ecology & evolution, 16(7), 351-358.
Cordaux, R., & Batzer, M. A. (2009). The impact of retrotransposons on human genome evolution. Nature Reviews Genetics, 10(10), 691-703.
Kapusta, A., et al. (2013). Transposable elements are major contributors to the origin, diversification, and regulation of vertebrate long noncoding RNAs. PLoS genetics, 9(4), e1003470.
Elliot, T. A., & Gregory, T. R. (2015). What's in a genome? The C-value enigma and the evolution of eukaryotic genome content. Philosophical Transactions of the Royal Society B: Biological Sciences, 370(1678), 20140331.
Lynch, M., & Conery, J. S. (2003). The origins of genome complexity. Science, 302(5649), 1401-1404.
Malone, C. D., & Hannon, G. J. (2009). Small RNAs as guardians of the genome. Cell, 136(4), 656-668.
Yoder, J. A., Walsh, C. P., & Bestor, T. H. (1997). Cytosine methylation and the ecology of intragenomic parasites. Trends in genetics, 13(8), 335-340.
Allshire, R. C., & Madhani, H. D. (2018). Ten principles of heterochromatin formation and function. Nature Reviews Molecular Cell Biology, 19(4), 229-244.
Carthew, R. W., & Sontheimer, E. J. (2009). Origins and Mechanisms of miRNAs and siRNAs. Cell, 136(4), 642-655.
Siomi, M. C., Sato, K., Pezic, D., & Aravin, A. A. (2011). PIWI-interacting RNAs: their biogenesis and function. Annual review of biochemistry, 80, 21-44.
Harris, R. S., & Liddament, M. T. (2004). Retroviral restriction factors: inhibitors of retroviral replication and mobilization of retroelements. Cytogenetic and genome research, 105(2-4), 297-307.
Chiu, Y. L., & Greene, W. C. (2008). The APOBEC3 cytidine deaminases: an innate defensive network opposing exogenous retroviruses and endogenous retroelements. Annual review of immunology, 26, 317-353.
Swanton, C., McGranahan, N., Starrett, G. J., & Harris, R. S. (2015). APOBEC enzymes: mutagenic fuel for cancer evolution and heterogeneity. Cancer discovery, 5(7), 704-712.
Fedoroff, N. V. (2012). Transposable elements, epigenetics, and genome evolution. Science, 338(6108), 758-767.
Mirouze, M., & Paszkowski, J. (2011). Epigenetic contribution to stress adaptation in plants. Current opinion in plant biology, 14(3), 267-274.
Horváth, A., et al. (2017). Stress-induced activation of transposons: Blessing or curse? Biochimica et Biophysica Acta (BBA)-Gene Regulatory Mechanisms, 1860(2), 255-270.
Goodier, J. L. (2016). Restricting retrotransposons: a review. Mobile DNA, 7(1), 16.
Schaack, S., Gilbert, C., & Feschotte, C. (2010). Promiscuous DNA: horizontal transfer of transposable elements and why it matters for eukaryotic evolution. Trends in ecology & evolution, 25(9), 537-546.
Oliver, K. R., & Greene, W. K. (2009). Transposable elements: powerful facilitators of evolution. Bioessays, 31(7), 703-714.
Volff, J. N. (2006). Turning junk into gold: domestication of transposable elements and the creation of new genes in eukaryotes. Bioessays, 28(9), 913-922.
Kapitonov, V. V., & Jurka, J. (2005). RAG1 core and V(D)J recombination signal sequences were derived from Transib transposons. PLoS biology, 3(6), e181.
Nakamura, T. M., et al. (1997). Telomerase catalytic subunit homologs from fission yeast and human. Science, 277(5328), 955-959.
Eickbush, T. H. (1997). Telomerase and retrotransposons: which came first? Science, 277(5328), 911-912.
Pardue, M. L., & DeBaryshe, P. G. (2003). Drosophila telomeres: voyageurs controlling chromosome ends. Current opinion in cell biology, 15(3), 251-259.
Dupressoir, A., Lavialle, C., & Heidmann, T. (2012). From ancestral infectious retroviruses to bona fide cellular genes: role of the captured syncytins in placentation. Placenta, 33(9), 663-671.
Cordaux, R., et al. (2006). Birth of a chimeric primate gene by capture of the transposase gene from a mobile element. Proceedings of the National Academy of Sciences, 103(21), 8101-8106.
Imbeault, M., Trono, D., et al. (2017). KRAB zinc-finger proteins contribute to the evolution of species-specific retroelement restriction. Nature, 548(7669), 580-584.
Casola, C., Hucks, D., & Feschotte, C. (2008). The CENP-B protein family: derived from pogo-like transposons? Trends in Genetics, 24(11), 534-538.
Long, M., Betrán, E., Thornton, K., & Wang, W. (2003). The origin of new genes: glimpses from the young and old. Nature Reviews Genetics, 4(11), 865-875.
Engels, W. R. (1983). The P family of transposable elements in Drosophila. Annual review of genetics, 17(1), 315-344.
Dion-Côté, A. M., & Barbash, D. A. (2017). Transposable elements as catalysts of genome divergence and speciation. Current opinion in genetics & development, 47, 50-57.
Robertson, H. M. (1993). The mariner transposable element is widespread in insects. Nature, 362(6417), 241-245.
Brookfield, J. F. (2005). The ecology of the genome—mobile DNA elements and their hosts. Nature Reviews Genetics, 6(2), 128-136.
Hancks, D. C., & Kazazian Jr, H. H. (2012). Active human retrotransposons: variation and disease. Current opinion in genetics & development, 22(3), 191-203.
Faulkner, G. J., & Billon, V. (2018). L1 retrotransposition in the soma: a field jumping ahead. Mobile DNA, 9(1), 22.
Burns, K. H. (2017). Transposable elements in cancer. Nature Reviews Cancer, 17(7), 415-424.
Wood, J. G., & Helfand, S. L. (2013). Chromatin structure and transposable elements in organismal aging. Frontiers in genetics, 4, 274.
Volkman, H. E., & Stetson, D. B. (2014). The enemy within: endogenous retroelements and autoimmune disease. Nature immunology, 15(5), 415-422.
Crow, Y. J., & Manel, N. (2015). Aicardi-Goutières syndrome and the type I interferonopathies. Nature Reviews Immunology, 15(7), 429-440.
Wallace, T. A., et al. (2018). Targeting transposable elements in cancer therapy. Cancer letters, 436, 137-146.
Kong, Y., et al. (2023). The dark side of the human genome: transposable elements as therapeutic targets. Trends in pharmacological sciences, 44(2), 85-99.
Bellen, H. J., et al. (2004). The BDGP gene disruption project: single transposon insertions associated with 40% of Drosophila genes. Genetics, 167(2), 761-781.
Hackett, P. B., Largaespada, D. A., & Cooper, L. J. (2010). A transposon and transposase system for human application. Molecular Therapy, 18(4), 674-683.
Cooley, L., Kelley, R., & Spradling, A. (1988). P element-mediated enhancer detection: an efficient method for isolating and characterizing developmentally regulated genes in Drosophila. Science, 239(4844), 1121-1128.
Ivics, Z., & Izsvák, Z. (2010). The expanding universe of transposon technologies for gene delivery and genome modification. Mobile DNA, 1(1), 25.
Sharma, N., et al. (2023). Transposon-based systems for gene therapy: recent advances and prospects. Molecular Therapy-Methods & Clinical Development, 29, 434-456.
Han, K., & Lee, J. (2017). Utility of Transposable Elements in Genealogical Studies. Genomics & informatics, 15(3), 83-89.
Voigt, K., et al. (2016). Targeted transposition: harnessing the power of transposable elements for genome engineering. Genes, 7(11), 103.
Venner, S., Feschotte, C., & Biémont, C. (2009). Dynamics of transposable elements: towards a community ecology of the genome. Trends in genetics, 25(7), 317-323.