Наука для людей
April 20, 2022

Джеффри Уэст: о манипулировании научными данными

Изначально существует множество аспектов, подходов, инструментов и даже подсказок для анализа и представления данных, которые впоследствии можно охарактеризовать как «манипулирование данными».

В данном материале, подготовленном на основе онлайн-панельной дискуссии конференции «Проблемы оценки источников в науке и связанных областях», основное внимание будет уделено основным причинам и преобладающим обстоятельствам, которые приводят к манипулированию данными. С точки зрения профессора Джеффри Уэста, существует две части вопроса: доступ к данным и достоверность этих данных.

В течение многих лет я проводил свои исследования в области физики высоких энергий, имея должный доступ и, таким образом, получал данные от компаний, которые можно было бы образно описать как «огромные научные ускорители», например, ЦЕРН в Швейцарии (Женева). Собственно говоря, в этом случае исследователь сталкивается с определенными препятствиями, поскольку имеет дело с конкретными экспериментальными данными.

Как правило, в физике высоких энергий у человека нет реальной возможности повторить эксперимент, что есть привилегия, которой он обладает в некоторых других традиционных научных дисциплинах. Я считаю, что это очень важный аспект, позволяющий подтверждать теории и предсказания, гипотезы и результаты анализа для других вещей для научного прогресса. Тем не менее, растет огромное доверие к тому, что все, что эта группа из тысячи экспериментаторов выполняла вместе, является правильными данными.

Иногда такие экспериментальные группы заявляют:

«Это то, что мы измерили. Это правда. Остальные должны нам доверять».

И они манипулировали данными, потому что все виды исправлений вносились прямо в процессе исследования; нередко предпринимается множество малейших манипуляций, чтобы привести «результат» в «общую форму», которую могут использовать другие исследователи. Однако даже таким данным нужно доверять. Естественно, степень доверия, безусловно, зависит от репутации и роста научного профиля за многие годы. Это один из полюсов проблемы.

ЦЕРН

Есть еще один крайний полюс. Я сотрудничал с компаниями и общественными организациями и столкнулся с проблемой совершенно иного характера: права собственности на данные. Это означает, что либо данные могут существовать, но к ним нельзя получить доступ, либо нужно заплатить огромные суммы денег, чтобы получить требуемые данные.

Опять же, эти данные в определенной степени «замаринованы»; в целом, ищут не чистые данные, а «манипулируемые» данные, даже если они платят эти деньги — например, данные, поступающие из налоговых деклараций компаний.

В целом тенденция такова: высокая степень достоверности данных часто не проверяется, что является огромной проблемой.

Однако еще более поразительная трудность коренится в том факте, что если кто-то хочет понять организацию как систему или «живой организм», он намеревается понять, что «происходит» внутри этой организации. Затем возникает еще одна проблема, которую можно охарактеризовать с помощью вопроса: «Что представляет собой конкретная компания или группа компаний для внутренних данных?»

Как правило, никто никогда не получает доступ к этому ящику «внутренних данных». Некоторые компании отправляют исследователю документы, аналогичные организационным схемам, которые представляют собой идеализированные версии того, чем является компания. Это не отражает реальности; он не указывает систему связи, системы взаимозаменяемости и так далее. В целом, это проблемная область, поскольку данные в той или иной форме подвергались манипуляции.

Я не встречал какой-либо проверенной методологии или набора инструментов для оценки данных, чтобы обойти эти крайности, поскольку организации (подобные упомянутым выше) не обязаны предоставлять ученых или других (даже политиков), заинтересованных в необработанных данных. Следовательно, это важный вопрос, особенно в социальных науках. Что касается физических наук, я хотел бы отметить, что это меньшая проблема; это становится проблемой в некоторых биологических, медицинских и фармацевтических науках из-за неизбежной роли денег и вознаграждения и того, кто пришел первым.

С этим связаны попытки федеральных агентств по всему миру, когда они поддерживают исследования, настаивать на том, чтобы исследователи делали свои данные доступными; нет никакой прозрачности. Однако многие исследователи игнорируют этот факт. Это действительно нерешенная проблема, поскольку ученых и исследователей заставляют применять данные, которые они предоставляют, что иногда не вызывает доверия.

В целом, это наиболее важные аспекты и проблемы манипулирования данными, которые необходимо решить.

Я считаю, что у этих проблем есть решение, и оно может быть достигнуто в основном совместными усилиями членов научного и академического сообществ. Более того, я обеспокоен тем, что те же аспекты и аналогичные проблемы остаются за проблемой точности и достоверности данных Википедии (тот же вопрос касается других цифровых энциклопедий в Интернете).

Среда диктует свои условия и вносит изменения: в наши дни люди работают в основном через Интернет.

У всех нас есть ограничения по времени, а также ограничения доступа. Меня беспокоит долгосрочный доступ к необработанным данным, к которым может иметь доступ исследователь, компания или политик; набор методов и подходов помогает проверять данные и обеспечивать их достоверность. Меня в равной степени беспокоит то, что некоторыми частями данных традиционно манипулировали. То есть манипулируемые не отрицательно, а положительно представленные данные научной аудитории, которые может эффективно использовать любой исследователь. Тем не менее, это также должно быть завершено, и ученые часто получают, получают и даже производят данные, которые были «модифицированы» для тех, кто впоследствии имел дело с результатами исследования. Это сделано как с точки зрения их исследований, так и с точки зрения их прав собственности и их претензий на оригинальность.

Наконец, я предполагаю, что если эти проблемы манипулирования данными и источниками научной информации не будут решены сейчас, они только ухудшат общее положение науки в будущем.

Джеффри Брайан Уэст - физик-теоретик, бывший президент и заслуженный профессор Института Санта-Фе.

Джеффри Уэст

Данная статья была опубликована в нашем журнале "Гранит науки" (с. 22) - ссылка на PDF

✒️Подписывайетсь на наш Telegram канал "Гранит науки"
✒️Читайте нас на Яндекс Дзен

📩У нас есть страница на Facebook и Вконтакте
📩Сайт журнала "Гранит Науки" un-sci.com
📩Прислать статью [email protected]
📩Написать редактору [email protected]