«Применение ИИ в биотехе требует больше экспертизы, чем в других сферах»
Борис Янгель, старший инженер по машинному обучению в компании CHARM Therapeutics, – об использовании искусственного интеллекта в биофарме
Борис, для чего и какие именно технологии ИИ используются в фармацевтике?
Применение технологий ИИ в биотехе можно разделить на две большие группы:
- Предсказание результатов химических и биологических экспериментов.
- Решение задач комбинаторного поиска и дизайна.
К первой группе относятся ситуации, когда существует необходимость установить какое-то свойство химико-биологического объекта. Например, понять, в какую структуру свернется белок, состоящий из определенной последовательности аминокислот, определить степень токсичности молекулы в организме или понять, может ли некоторая молекула установить прочную связь с определенным белком, если окажется поблизости.
Другая группа – так называемые задачи поиска, или дизайна. Сюда относятся случаи, когда вам нужно решить обратную задачу: не установить какое-то свойство известного заранее биологического объекта, а найти объект, таким свойством обладающий. Например, молекулу или белок, которые могут установить прочную связь с заданным белком и ингибировать его.
В основном в биофарме используются нейросети, ведь химические и биологические объекты нельзя свести к абстрактным последовательностям чисел, они обладают богатой структурой. Нейросети позволяют закодировать в себе обусловленные этим ограничения, что радикально улучшает качество предсказаний.
Как технологии ИИ помогают вам в решении ваших задач в CHARM Therapeutics? Что входит в круг ваших обязанностей?
Компания, в которой я работаю, специализируется на химических соединениях, которые способны воздействовать на организм путем регулирования определенного белка. Чтобы создать такое лекарство, необходимо:
- Найти молекулы-кандидаты, которые способны установить связь с нужным белком.
- Оптимизировать эти молекулы, чтобы добиться нужных свойств или усилить их.
Все эти процессы можно ускорить и удешевить, применяя ИИ-модели. И моя роль как специалиста по AI состоит в том, чтобы в тандеме с экспертами в предметной области разрабатывать подобные модели, улучшать их качество, а также валидировать то, насколько модельные предсказания расходятся с экспериментальными, чтобы мы понимали, в каких ситуациях нужно доверять моделям, а когда лучше обратиться к экспериментальным методам.
Какие биофарм-компании вы бы назвали лидерами в использовании технологий ИИ и почему?
Не находясь внутри бизнеса, достаточно тяжело судить о том, насколько его деятельность успешна именно в силу использования технологий ИИ, тем более что компании не стремятся делиться подобной информацией.
Я бы порекомендовал обратить внимание на Isomorphic Labs, «дочку» Alphabet, имеющую доступ к талантам, технологиям и вычислительным ресурсам Google и DeepMind. Я не буду сильно удивлен, если очередная революция придет оттуда.
Ранее вы занимались обучением беспилотных автомобилей и голосового помощника. В чем принципиальная разница в подходах к внедрению ИИ в различных областях?
Применение технологий ИИ в разных областях очень похоже: у вас есть данные, есть модели, вы обучаете модели на этих данных и затем используете полученные результаты в работе.
Одна из особенностей биотеха – сравнительно небольшие базы данных из-за высокой стоимости и сложности их получения. В общедоступной базе структур белков PDB всего около двухсот тысяч записей, что по меркам машинного обучения крайне мало. Для решения задач нужно использовать довольно креативные методы, а соответствующая экспертиза в их применении есть не у многих.
Также биотех невыгодно отличается «шумом» и системными сдвигами в данных. Если их массивы были получены в разных лабораториях, между этими данными могут быть различия, обусловленные используемым экспериментальным оборудованием и подходом к интерпретации результатов.
Применение ИИ в биотехе требует больше экспертизы, чем в других сферах, где мне довелось поработать.