Нейросети и химия: ключ к открытиям или кризис науки

Автор статьи Илья Развин

Личное мнение: заменят ли нейросети ученых с нулевой полезностью?
Реакция ученых старой школы на возможности ИИ
Кейс: Upgraide решает за минуты то, на что у ученых уходят дни
О проблемах научной этики и нейросетей: путь к деградации и кризис публикационной системы
О репутационных рисках при использовании нейросетей

Отвечает ученый, кандидат технических наук, доцент.

Заменят ли нейросети ученых с нулевой полезностью?

Я, поработав в сервисе, был напуган, потому что это реально сделает бесполезным, с точки зрения химии, 90% сотрудников. Потому что он выдаёт гораздо более разумные тезисы. Он способен решать задачи прикладного характера. Способен интерпретировать результаты. Он делает то, что не способны делать 99% студентов на выходе из базовой системы бакалавриата в любой стране мира.

Компетенции и навыки, закладываемые в бакалавриате, не предполагают, что студент получит столь глубокие степень, знания и уровень проработки научных материалов или интерпретирования результатов экспериментов. А их спокойно предлагают нейросети.

Ученые без амбиций и высоких целей, работающие только за зарплату и не имеющие иной мотивации, уйдут в небытие, потому что нейросеть сможет делать их работу гораздо быстрее и эффективнее.

Для ленивого студента или безынициативного ученого, пишущего статьи только для продления конкурса гораздо удобнее обратиться к нейросети за разъяснениями или интерпретацией результатов, чем искать статью ноунейм автора.

В то же время, Upgraide, как инструмент или скорее проводник для любой нейросети — это очень квалифицированный помощник. Он, в роли химика, биотехнолога, и просто как собеседник, более развитый и адаптивный. Он достаточно оперативно реагирует на изменения, в том числе и по режиму письма.

Но у меня эмоции разные: есть и интерес, радость, потому что я смог значительно сократить время на поиск известных технологий или их адаптацию под задачи.

Например, собрал полноценный “скелет” литературного обзора магистерской диссертации всего за 5 минут. Стандартное время для такого с учетом серфинга интернета по доступным технологиям для обычного преподавателя - до 2 часов.

Реакция ученых старой школы на возможности ИИ

Я немного похвастался продуктом коллегам и своему научному руководителю, когда привёз ему отзыв на диссертацию.

Как происходит защита диссертации? Ее рассматривает совет, пишет заключение: нравится, не нравится, что доработать, если все нравится, значит, принимаем к защите. Руководитель дал мне диссертацию, посмотреть экспертным взглядом.

Читаю, а кусочки работы будто «писала нейросеть». Так и прокомментировал в заключении, аргументировал, что тест на плагиат идеальный, слог очень похож. С опытом уже видишь разницу между текстами человека и машины. А самое интересное: я проверил кусок работы нейросетью. На вопрос «Твоя ли это работа?» был дан исчерпывающий ответ, с аргументами и мотивацией. Вероятность применения нейросети 90-95 %.

И вот коллеги спрашивают: «а что такое нейросеть?». Я показал мой диалог и получил оценку: «да, через 5 лет нас заменят». Это кандидаты и доктора наук, достаточно известные, в возрасте, но вот к новшествам отнеслись они именно так. Хотя надо отдать должное, похвалили высокий уровень ответа, прогнозирования.

Даже поколение маститых учёных подтверждают тот факт, что нейросеть — это достаточно полезная вещь.

Я не решаю в сервисе бытовые вопросы, нельзя сказать, что обращаюсь к нему и по рабочим: я бы сказал экспериментирую. Собрал со своих студентов, коллег и со всего окружения самые интересные вопросы, которые по их тематике касались: кто-то работает с окислителями, с очисткой воды, с биосинтезом или, например, с микроорганизмами. И не осталось ни 1 вопроса, на который бы чат не ответил или ответил бы не в полной мере.

Рутинную рабочую задачу я готов решать в Upgraide. Более того, у меня все коллеги, которые со мной работают на кафедре и в лаборатории, что подобные системы для ученого позволяют существенно сократить время.

Мой собственный кейс был с полимерным клеем. Один хороший человек попросил совета, подкинув прикладную задачу: «есть материал для склейки древесины (производство ДСП) - нужно найти аналог».

Мой профиль неорганический синтез, и полимерные материалы для меня не являются близкой темой. Поэтому задача была успешно передана специалистам.

Как это решили? Консультация со специалистом -полимерщиком. Несколько часов на высокоэффективной жидкостной хроматографии, 2 или 3 термограммы на образцы. То есть это комплект исследований примерно на 4 полных дня на 3-4 человека. В лаборатории реально подобрали литературу аналитическую, напрягались, делали, потратили кучу растворителей. Работали, считай, полную рабочую неделю. Стоимость работ в Центре коллективного пользования одного из ВУЗов превысила 40 000 ₽.

Upgraide решил эту задачу примерно за 1,5 минуты.

Предложенные варианты клеящих составов на 100 % совпали с данными собранными целой группой исследователей, при этом система предложила не 1, а более 10 аналогов с разными параметрами.

Я был доволен, но с другой стороны, мне было грустно. Сейчас объясню. Нейросети, как инструмент, хороши в чистых, светлых, умелых руках.

Ученому этот чат — мега помощник, потому что он позволяет генерировать новые идеи, отсеивать заведомо нереализуемые варианты, выбирать наиболее перспективные направления развития, при этом обязательным условием применения нейросети является проверка гипотез на практике.

В части задач, которые я ему давал, например, по синтезу пероксодисерной кислоты, он мне предлагал те решения, о которых не знал я. Я не добрался в степени глубины научного поиска до тех причин, до которых добрался он.

Простой кейс: объяснить почему реакция с положительной энергией Гиббса протекает в стандартных условиях. Ответ нейросети - 8 вариантов промежуточных реакций и полупродуктов, способных в конечном итоге получать заданное соединение. 5 из представленных вариантов были мне известны, при этом изучение 3-х новых позволило дать грамотное описание результатам экспериментов. В итоге: хорошая научная статья уровня ВАК К 1.

Он помогает интерпретировать задания, предлагает корректирующие варианты. Кейс от коллег: у нас есть исследования по средам для культивирования лактобактерий. Продукты-метаболиты сильно закисляют субстрат и ингибируют процессы роста микроорганизмов и синтез ферментов. 3 модели нейросетей (Claude 3 Opus, GPT-4, Mistralle) на запрос предложить рецептуры сред, выдали химически грамотные и самое главное сбалансированные среды. Причём это был не единый экземпляр среды, а несколько вариантов с варьированием компонентов. И компоненты были не просто предложены, как «возьмите это, смешайте с этим», а с были предложены концентрации!

Добавлю ложку дегтя: из 7 предложенных вариантов работоспособными оказались только 2. Но это вопрос только времени и эволюции нейросети.

О проблемах научной этики: кризис публикационной системы и обесценивание труда

Нейросети — это одновременно и надежда, и смерть нашей науки в целом. Не какой-то отдельной страны, а мировой. В умелых руках нейросеть будет спасать, помогать, оказывать поддержку, сокращать время на литературный поиск. Но, если такая вещь попадёт в полном доступе и функционале ленивым ученым или студентам, то написание научных работ превратится в безумную штамповку.

Сейчас уже есть много научных «принтеров», которые имеют индексы Хирша [количественная характеристика продуктивности ученого] 200, 300, 400 локально. У известного ученого, члена диссертационного совета базовый индекс — 15 или 16.

Есть зарубежные ученые с индексом Хирша по местной базе данных около 500. То есть — это поток статей самоцитирующихся и самодублирующих написанные им же материалы, скажем так, не очень высокого качества. И не меньшую обеспокоенность вызывает наличие определённых контор, которые оказывают услуги по содействию в публикации. Регулярно приходят спам-рассылки «примите участие в конференции». Все зарубежные, кстати, российские не приходят, как ни странно. Испания, Португалия, Япония, Китай. «Попадайте в тему статей, а мы ее адаптируем». У меня есть подозрение, что адаптация будет происходить с помощью какого-нибудь нейроинтерфейса.

Ну и главная проблема — обесценивание научного труда. Пока кто-то будет работать в лаборатории, развивать навыки, получать знания, писать, возможно, не очень качественные, но личные и душевные статьи, то другой, не самый честный, но прошаренный в IT-технологиях, студент будет писать аналогичные работы со сгенерированными или смоделированными результатами какого-нибудь эксперимента. К сожалению, чаты на это тоже способны. Они способны моделировать или предсказывать выход тех или иных условий. Один из моих кейсов был смоделировать продукты реакции — ответ Claude 3 Opus был 100% верным.

Хочу рассказать о достаточно известном журнале, точнее, издательском доме MDPI (www.mdpi.com).

MDPI основан в 1996 году химиком китайского происхождения Шу-Кун Линем первоначально лишь в качестве архива химических образцов, но к настоящему времени стал крупнейшим издательством журналов с открытым доступом в мире и пятым издательством по объему издания статей. Все журналы MDPI с 2008 года находятся в открытом доступе и публикуются под лицензией Creative Commons Attribution License (CC-BY).

Рецензирование в журнале происходит в живом варианте: они присылают статью авторам. И сейчас там появилась галочка «Я отвечаю за то, что я не использовал при рецензировании никакие нейросети».

Это одна галочка, а еще там появилась плашка о том, что статья, поступившая на рецензирование, проверена на нейросетях, и что количество труда нейросети в написании этой статье не превышает какого-то процента.

Как это проверяется, честно, не знаю. Мне кажется, что это плашка больше для запугивания. Потому что проекты, которые были у того же Open Ai по распознаванию, закрылись. Они так и объяснили, что изображения или текст, написанные нейросетью, при правильной обработке невозможно распознать. А текст нейросети, проверенный в Антиплагиате, показывает 100% оригинальность.

Кейс. Есть такая проблема пластика, известная: его надо куда-то перерабатывать. Одна из моих коллег занимается выработкой ферментов, всяких молей и личинок, которые пластик спокойно пожирают. И одна из задач, которые я задал Upgraide, это поиск альтернативных видов микроорганизмов, способных поедать или разлагать за счёт какой-то химической реакции пластик.

И в одном из ответов промелькнула достаточно весёлая вещь, что цераза и PETаза [2 фермента, которые отвечают за размножение пластика] — это по большому счёту синонимы, за исключением некоторых ответвлений.

С точки зрения научного мира, PETазу продвигают японцы, и по их мнению, это абсолютно новый класс ферментов, новый класс реагентов, супер новых и никому неизвестных. И на этом делают себе огромный индекс Хирша. При этом благодаря Upgraide.me мы обнаружили, что цераза, тот фермент из восковой моли, и PETаза, который продвигают учёные, на самом деле сродни соединениями. Два фермента по большому счёту являются синонимичными. Радует одно, что тут хотя бы есть массив экспериментальных данных, и выполненный труд имеет практическую значимость.

При этом в недалеком будущем не исключен вариант полного ухода от реальности в пользу генерации «открытий» и «изобретений» через нейросети, а будут ли экспериментально проверены данные материалы - вопрос к порядочности участников научных групп.

Репутационные риски для человека науки

С точки зрения ученого, который следит за своей репутацией, и только что рассказал как просто можно «стать» профессионалом, увеличив индекс Хирша с помощью нейросетей, любая привязка к использованию LLM в работе вызывает скорее подозрительную реакцию. В дальнейшем любую твою работу будут рассматривать в этом ключе.

Нейросеть скоро станет хорошим фильтром для квалификации. Она задавит серую массу тех, кто сидит и ничего не делает. А настоящие ученые используют ее, как развитие, и как трамплин для своих исследований.

ident1ka, 2024