August 10, 2020

Гены и эксель

Комитет по номенклатуре генов рекомендовал поменять названия у нескольких десятков человеческих генов. Как пишет The Verge, причиной этого стало автоформатирование в Microsoft Excel, из-за которого в научных работах возникали ошибки.

Наименования генов обычно состоят из нескольких букв (чаще всего это аббревиатура, указывающая на назначение гена) и могут дополняться цифрами. Некоторые из ранее существовавших имен были схожи с названиями месяцев года, из-за чего Excel, которым в своих работах пользуются ученые по всему миру, интерпретировал их как даты. Например, при записи в ячейку Excel названия гена MARCH1 программа автоматически преобразовывала его в «1 марта».

В общей сложности за последний год Комитет по номенклатуре генов выпустил рекомендации по переименованию 27 генов. Так, например, MARCH1 стал MARCHF1, а SEPT1 — SEPTIN1.

The Verge отмечает, что хотя в Excel при заполнении таблицы можно отключить автоматическое форматирование, это не решает проблему: когда файл откроет другой человек, у которого эта функция по умолчанию включена, данные все равно преобразуются.

Ошибки такого рода являются чрезвычайно распространенными. В 2016 году было проведено исследование, участники которого изучили 3597 научных работ, опубликованных в рецензируемых научных журналах — примерно в каждой пятой нашли ошибки, вызванные автоматическим форматированием данных в Excel.

Источник: meduza.io