Новая ИИ от DeepMind способна предсказывать генетические заболевания

AlphaMissense, новая модель от команды искусственного интеллекта Google, анализирует эффекты мутаций ДНК и ускорит исследования редких заболеваний.

#deepmind #искусственныйинтеллект #генетическиезаболевания #алгоритм #мутации #белки #наука #исследования #медицина #биология

ИЛЛЮСТРАЦИЯ: PASIEKA/SPL

ОКОЛО 10 ЛЕТ назад Жига Авсец был студентом аспирантуры по физике, который оказался на интенсивном курсе геномики через университетский модуль машинного обучения. Вскоре он работал в лаборатории, занимавшейся изучением редких заболеваний, в рамках проекта, направленного на выявление точной генетической мутации, вызывающей необычное митохондриальное заболевание.

Это была, по словам Авсеца, проблема "иголки в стоге сена". В генетическом коде скрывались миллионы потенциальных преступников - мутации ДНК, способные нарушить биологию человека. Особый интерес представляли так называемые неправильные варианты: изменения одной буквы в генетическом коде, которые приводят к созданию другой аминокислоты внутри белка. Аминокислоты являются строительными блоками белков, а белки - строительными блоками всего остального в организме, поэтому даже незначительные изменения могут иметь большие и далеко идущие последствия.

В геноме человека существует 71 миллион возможных неправильных вариантов, а у обычного человека их более 9 000. Большинство из них безвредны, но некоторые имеют отношение к генетическим заболеваниям, таким как сиклоклеточная анемия и кистозный фиброз, а также более сложным состояниям, таким как сахарный диабет 2 типа, который может быть вызван комбинацией небольших генетических изменений. Авсец стал задавать своим коллегам вопрос: "Как мы можем узнать, какие из них на самом деле опасны?" Ответ был: "В основном, мы не знаем".

Из 4 миллионов неправильных вариантов, обнаруженных у людей, только 2 процента были классифицированы как патогенные или безвредные в результате многолетних тщательных и дорогостоящих исследований. Изучение влияния одного неправильного варианта может занять месяцы.

Сегодня Google DeepMind, где Авсец сейчас является научным сотрудником, выпустил инструмент, который может значительно ускорить этот процесс. AlphaMissense - это модель машинного обучения, которая может анализировать неправильные варианты и предсказывать вероятность вызова заболевания с точностью 90 процентов - лучше существующих инструментов.

Она основана на AlphaFold, революционной модели DeepMind, которая предсказывала структуры сотен миллионов белков по их аминокислотной композиции, но работает по-другому. Вместо предсказания структуры белка AlphaMissense работает больше как большая языковая модель, например, ChatGPT от OpenAI.

Она обучена на языке человеческой (и приматской) биологии, поэтому она знает, как должны выглядеть нормальные последовательности аминокислот в белках. Когда ей представляется последовательность, содержащая ошибку, она замечает это, подобно несоответствующему слову в предложении. "Это языковая модель, но обученная на последовательностях белков", - говорит Джун Чэнг, который вместе с Авсецем является соавтором статьи, опубликованной сегодня в журнале Science, которая объявляет о появлении AlphaMissense в мире. "Если мы заменим слово в английском предложении, человек, знакомый с английским, сразу поймет, изменится ли значение предложения или нет".

Пушмит Кохли, вице-президент исследований DeepMind, использует аналогию с кулинарной книгой. Если AlphaFold интересовалась тем, как ингредиенты могут соединяться, то AlphaMissense предсказывает, что может произойти, если вы используете совсем неподходящий ингредиент.

Модель присваивает "оценку патогенности" от 0 до 1 каждому из 71 миллиона возможных вариантов миссенс мутаций на основе информации о влиянии других близких мутаций - чем выше оценка, тем больше вероятность того, что конкретная мутация вызывает или связана с заболеванием. Исследователи DeepMind сотрудничали с Genomics England, государственным органом, изучающим накопившийся генетический материал, собранный Национальной службой здравоохранения Великобритании, чтобы проверить прогнозы модели на основе реальных исследований уже известных вариантов миссенс мутаций. В статье утверждается, что AlphaMissense обладает точностью в 90 процентов, при этом классифицируется 89 процентов вариантов.

Исследователи, пытающиеся выяснить, может ли конкретный вариант миссенс мутации лежать в основе заболевания, теперь могут найти его в таблице и узнать предсказанную оценку патогенности. Надежда заключается в том, что, как и AlphaFold, поддерживающая все, начиная от поиска лекарств до лечения рака, AlphaMissense поможет исследователям в различных областях ускорить исследования генетических вариантов, позволяя им быстрее диагностировать заболевания и находить новые методы лечения. "Я надеюсь, что эти предсказания помогут нам получить дополнительное представление о том, какие варианты вызывают заболевания и имеют другие применения в геномике", - говорит Авсек.

Исследователи подчеркивают, что предсказания следует использовать лишь в качестве руководства для реальных исследований: AlphaMissense может помочь исследователям определить приоритеты в медленном процессе сопоставления генетических мутаций с заболеваниями, быстро исключая маловероятных виновников. Она также может помочь улучшить наше понимание недооцененных областей нашего генетического кода: модель включает метрику "существенности" для каждого гена - меру его важности для выживания человека. (Функция приблизительно пятой части генов человека неизвестна, несмотря на то, что многие из них, кажется, являются неотъемлемыми.)

AlphaMissense не совсем в той же "ошеломляющей" категории, что и AlphaFold, говорит Иван Бирни, заместитель генерального директора Европейской молекулярной биологической лаборатории и совместный директор лаборатории Европейского биоинформатического института, которая тесно сотрудничала с DeepMind в прошлом, но не была замешана в этом исследовании. "Как только появился AlphaFold, все знали, что с помощью этой модели должно быть возможно интерпретировать мутации, изменяющие белки", - говорит он.

Бирни видит особое применение в помощи врачам в быстрой диагностике детей с подозрением на генетические заболевания. "Мы всегда знали, что миссенс мутации могут быть ответственными за некоторые случаи, которые остаются недиагностированными, и это лучший способ классифицировать эти случаи". Он приводит пример гена RPE65, который вызывает слепоту, если его не лечить инъекциями генной терапии в сетчатку глаза. AlphaMissense может помочь врачам быстро исключить любые другие потенциальные генетические мутации в ДНК пациента - их может быть тысячи - чтобы быть уверенными, что они применяют правильное лечение.

Помимо раскрытия эффектов мутаций одной буквы, AlphaMissense демонстрирует потенциал моделей ИИ в биологии более широко. Поскольку он не был специально обучен решать проблему миссенс-вариантов, но скорее общим образом на том, какие белки находятся в биологии, применения этой модели и аналогичных ей могут выходить далеко за рамки одиночных мутаций, чтобы лучше понять нашу геном и то, как он выражается - от книги рецептов до целого ресторана. "Основа модели происходит от AlphaFold", - говорит Кохли. "Значительная часть этой интуиции была, в каком-то смысле, унаследована от AlphaFold, и мы смогли показать, что она обобщается на эту связанную, но достаточно другую задачу".