«Применение ИИ в биотехе требует больше экспертизы, чем в других сферах»

Борис Янгель, старший инженер по машинному обучению в компании CHARM Therapeutics, – об использовании искусственного интеллекта в биофарме

Фото: личный архив Бориса Янгеля

Борис, для чего и какие именно технологии ИИ используются в фармацевтике?

Применение технологий ИИ в биотехе можно разделить на две большие группы:

Предсказание результатов химических и биологических экспериментов.
Решение задач комбинаторного поиска и дизайна.

К первой группе относятся ситуации, когда существует необходимость установить какое-то свойство химико-биологического объекта. Например, понять, в какую структуру свернется белок, состоящий из определенной последовательности аминокислот, определить степень токсичности молекулы в организме или понять, может ли некоторая молекула установить прочную связь с определенным белком, если окажется поблизости.

Другая группа – так называемые задачи поиска, или дизайна. Сюда относятся случаи, когда вам нужно решить обратную задачу: не установить какое-то свойство известного заранее биологического объекта, а найти объект, таким свойством обладающий. Например, молекулу или белок, которые могут установить прочную связь с заданным белком и ингибировать его.

В основном в биофарме используются нейросети, ведь химические и биологические объекты нельзя свести к абстрактным последовательностям чисел, они обладают богатой структурой. Нейросети позволяют закодировать в себе обусловленные этим ограничения, что радикально улучшает качество предсказаний.

Как технологии ИИ помогают вам в решении ваших задач в CHARM Therapeutics? Что входит в круг ваших обязанностей?

Компания, в которой я работаю, специализируется на химических соединениях, которые способны воздействовать на организм путем регулирования определенного белка. Чтобы создать такое лекарство, необходимо:

Найти молекулы-кандидаты, которые способны установить связь с нужным белком.
Оптимизировать эти молекулы, чтобы добиться нужных свойств или усилить их.

Все эти процессы можно ускорить и удешевить, применяя ИИ-модели. И моя роль как специалиста по AI состоит в том, чтобы в тандеме с экспертами в предметной области разрабатывать подобные модели, улучшать их качество, а также валидировать то, насколько модельные предсказания расходятся с экспериментальными, чтобы мы понимали, в каких ситуациях нужно доверять моделям, а когда лучше обратиться к экспериментальным методам.

Какие биофарм-компании вы бы назвали лидерами в использовании технологий ИИ и почему?

Не находясь внутри бизнеса, достаточно тяжело судить о том, насколько его деятельность успешна именно в силу использования технологий ИИ, тем более что компании не стремятся делиться подобной информацией.

Я бы порекомендовал обратить внимание на Isomorphic Labs, «дочку» Alphabet, имеющую доступ к талантам, технологиям и вычислительным ресурсам Google и DeepMind. Я не буду сильно удивлен, если очередная революция придет оттуда.

Ранее вы занимались обучением беспилотных автомобилей и голосового помощника. В чем принципиальная разница в подходах к внедрению ИИ в различных областях?

Применение технологий ИИ в разных областях очень похоже: у вас есть данные, есть модели, вы обучаете модели на этих данных и затем используете полученные результаты в работе.

Одна из особенностей биотеха – сравнительно небольшие базы данных из-за высокой стоимости и сложности их получения. В общедоступной базе структур белков PDB всего около двухсот тысяч записей, что по меркам машинного обучения крайне мало. Для решения задач нужно использовать довольно креативные методы, а соответствующая экспертиза в их применении есть не у многих.

Также биотех невыгодно отличается «шумом» и системными сдвигами в данных. Если их массивы были получены в разных лабораториях, между этими данными могут быть различия, обусловленные используемым экспериментальным оборудованием и подходом к интерпретации результатов.

Применение ИИ в биотехе требует больше экспертизы, чем в других сферах, где мне довелось поработать.