Гонка за обнаружением ИИ в разгаре
И студенты колледжей разрабатывают оружие, быстро создавая инструменты, которые идентифицируют текст, созданный искусственным интеллектом, и инструменты для уклонения от обнаружения.
#искусственныйинтеллект #медиа #подлинность #искусственныйинтеллектвмедиа #происхождение #ai #текстовыйклассификатор #gptzero #человеческийтекст #искусственныйинтеллектвписьме
Эдвард Тянь не считал себя писателем. Как студент компьютерных наук в Принстоне, он посещал несколько журналистских курсов, где изучал основы репортажа, и его солнечная энергетика и любознательность покорили его преподавателей и однокурсников. Но он описывает свой стиль письма тогда как "довольно плохой" - формульный и неуклюжий. Один из его преподавателей по журналистике сказал, что Тянь хорош в "распознавании образцов", что было полезно при написании новостных материалов. Так что Тянь был удивлен, когда, будучи второкурсником, ему удалось получить место в эксклюзивном семинаре по написанию научно-популярных статей Джона Макфи.
Каждую неделю 16 студентов собирались, чтобы услышать, как легендарный писатель из New Yorker разбирает свои произведения. Макфи давал задания, которые заставляли их тщательно мыслить о словах: описывать произведение современного искусства на кампусе или сокращать Геттисбургский адрес по длине. С помощью проектора и слайдов Макфи демонстрировал рукописные диаграммы, иллюстрирующие различные способы структурирования своих эссе: прямая линия, треугольник, спираль. Тянь помнит, как Макфи говорил, что не может научить своих студентов писать, но он может помочь им найти свой собственный уникальный голос.
Если Макфи разжигал романтическое представление о языке в Тяни, то компьютерная наука предлагала другую перспективу: язык как статистика. Во время пандемии он взял год отпуска, чтобы работать в BBC и проходить стажировку в проекте журналистики Bellingcat, где писал код для обнаружения ботов в Twitter. Как студент третьего курса, он посещал занятия по машинному обучению и обработке естественного языка. А в осень 2022 года он начал работать над своей выпускной работой по обнаружению различий между текстом, созданным искусственным интеллектом, и текстом, написанным человеком.
Когда ChatGPT дебютировал в ноябре, Тянь оказался в необычной ситуации. В то время, как весь мир сошел с ума по поводу этого нового, радикально улучшенного чатбота, Тянь уже был знаком с технологией GPT-3, лежащей в его основе. И как журналист, занимавшийся борьбой с дезинформацией, он понимал последствия создания контента искусственным интеллектом для индустрии.
Находясь в Торонто на каникулах, Тянь начал играться с новой программой: детектором ChatGPT. Он сидел в своем любимом кафе, наливая себе чай жасмин, и поздно вечером занимался программированием в своей комнате. Его идея была проста. Программа должна была сканировать текст на два фактора: "затруднительность", случайность выбора слов; и "вариативность", сложность или изменчивость предложений. Человеческое письмо обычно показывает более высокие показатели по обоим метрикам, что позволяло Тяни угадывать, как был создан текст. Тянь назвал инструмент GPTZero—"ноль" символизировал правду, возвращение к основам—и разместил его в интернете вечером 2 января. Он опубликовал ссылку в Twitter с кратким введением. Целью было бороться с "растущим плагиатом, созданным искусственным интеллектом", он написал. "Будут ли учителя средней школы хотеть, чтобы ученики использовали ChatGPT для написания своих исторических эссе? Скорее нет". Затем он пошел спать.
Тянь проснулся на следующее утро от сотен ретвитов и ответов. Трафик на сервер хостинга был такой большой, что многие пользователи не могли получить доступ к нему. "Это было совершенно сумасшедшим", - говорит Тянь. "Мой телефон взорвался". Один из друзей поздравил его с победой в интернете. Подростки на TikTok назвали его доносчиком. "Много начальной ненависти было вроде: 'Этот парень является доносчиком, у него нет жизни, у него никогда не было девушки'", - сказал Тянь с улыбкой. "Классическое". (У Тяня есть девушка.) В течение нескольких дней он получал звонки от журналистов со всего мира и в конечном итоге появился на таких программ как NPR, South China Morning Post и Anderson Cooper 360. В течение недели его первоначальный твит набрал более 7 миллионов просмотров.
GPTZero стал новым шагом в медиа-истории вокруг ChatGPT, который вдохновил общую тревогу относительно искусственного интеллекта и привел к бушующему всплеску AI-созданных заголовков. (Исследователи создали детектор для текста GPT-2 в 2019 году, но Тянь был первым, кто нацелился на ChatGPT). Учителя благодарили Тяня за его работу, благодаря которой они, наконец, могли подтвердить свои подозрения относительно подозрительных эссе студентов. Нашло ли человечество спасителя от роботизации?
Программа Тяня стала своеобразным стартовым пистолетом. Сейчас началась гонка за создание идеального инструмента обнаружения ИИ. В мире, все больше насыщенном контентом, созданным искусственным интеллектом, мы будем нуждаться в различении между тем, что создано машиной, и тем, что создано человеком. GPTZero обещает, что это будет возможно, и утверждает, что это имеет значение. Во время своего медиатурне, Тянь - улыбчивый, серьезный, воплощение отличника - углубился в эту успокаивающую точку зрения о том, что несмотря на то, насколько совершенными становятся генеративные инструменты ИИ, мы всегда сможем их разоблачить. В человеческом письме есть нечто недоступное числам, сказал Тянь: «В нем есть элемент, который никогда не может быть представлен в цифрах».
Жизнь в интернете всегда была битвой между обманщиками и детекторами обмана, и обе стороны извлекали выгоду из этого противостояния. Ранние спам-фильтры просеивали электронные письма на ключевые слова, блокируя сообщения с фразами типа «БЕСПЛАТНО!» или «старше 21», и в конечном итоге научились фильтровать целые стили письма. Спаммеры отвечали, окружая свои предложения отрывками звучащего по-человечески текста, взятого из старых книг и сложенного воедино. (Этот тип сообщения, получивший название "литспам", стал отдельным жанром). С ростом популярности поисковых систем создатели, стремящиеся повысить рейтинг своих страниц, прибегали к "заполнению ключевыми словами" - повторению одного и того же слова множество раз для приоритетного отображения. Поисковые системы предпринимали меры, чтобы снизить рейтинг таких сайтов. После того, как Google представил свой алгоритм PageRank, который предпочитал веб-сайты с большим количеством входящих ссылок, спаммеры создавали целые экосистемы взаимодополняющих страниц.
Вокруг начала нового тысячелетия появился инструмент captcha, который отличал людей от ботов на основе их способности интерпретировать изображения искаженного текста. Когда некоторые боты смогли справиться с этим, captcha добавила другие методы обнаружения, включая разбор изображений мотоциклов и поездов, а также определение движения мыши и других действий пользователя. (В недавнем тесте ранняя версия GPT-4 показала, что она знает, как нанять человека на Taskrabbit, чтобы выполнить captcha от ее имени.) Судьбы целых компаний зависели от способности обнаруживать подделки: Элон Маск, пытаясь избавиться от сделки по покупке Twitter, ссылался на детектор ботов, чтобы подкрепить свой аргумент, что Twitter неправильно указал количество ботов на своем сайте.
Генеративный ИИ повысил планку. В то время как большие языковые модели и генераторы текста визуальных изображений развивались последние десятилетия, 2022 год стал взрывным периодом для потребительских инструментов, таких как ChatGPT и Dall-E. Пессимисты утверждают, что мы вскоре можем утонуть в цунами синтетических медиа. "Через несколько лет подавляющее большинство фотографий, видео и текста, с которыми мы сталкиваемся в интернете, могут быть сгенерированы ИИ", предупреждал в прошлом году технологический колумнист New York Times Кевин Руз. The Atlantic представил наступление "текстопокалипсиса", когда мы будем бороться с фильтрацией генеративного шума. Политические кампании используют ИИ-инструменты для создания рекламы, а Amazon затоплен ChatGPT-написанными книгами (многие из них о ИИ). Прокрутка отзывов о товаре уже похожа на самый надоедливый тест Тьюринга. Следующий шаг кажется ясным: если вы думали, что электронные письма от нигерийских принцев были плохими, подождите, пока вы увидите чат-ботов нигерийских принцев.
Сразу после того, как Тянь выпустил GPTZero, появилась волна похожих продуктов. OpenAI выпустила свой собственный инструмент обнаружения в конце января, в то время как Turnitin, гигант по борьбе с плагиатом, представил классификатор в апреле. Все они использовали одну и ту же методологию, но каждая модель обучалась на разных наборах данных. (Например, Turnitin сосредоточился на студенческом письме.) В результате точность варьировалась от 26 процентов, заявленных OpenAI, для обнаружения текста, созданного искусственным интеллектом, до самого оптимистичного утверждения от компании под названием Winston AI в 99,6 процента. Чтобы оставаться впереди конкурентов, Тяню придется продолжать улучшать GPTZero, придумывать следующий продукт и в то же время закончить колледж.
Сразу же Тянь привлек своего друга по средней школе Алекса Куи в качестве технического директора и в течение следующих нескольких недель привлек нескольких программистов из Принстона и Канады. Затем, весной, он привлек трио программистов из Уганды, которых он встретил четыре года назад, работая в стартапе, который обучает инженеров в Африке. (Будучи гражданином мира, Тянь родился в Токио и жил в Пекине до 4 лет, пока его родители, оба китайские инженеры, не переехали семью в Онтарио.) Вместе команда приступила к работе над следующим приложением: плагином для Chrome, который будет сканировать текст веб-страницы и определять, был ли он создан искусственным интеллектом.
Еще одной угрозой для GPTZero стал GPTZero. Почти сразу после его запуска скептики в социальных сетях начали публиковать нелестные примеры неправильной классификации текстов инструментом. Кто-то отметил, что он выделил некоторые части Конституции США как возможно созданные искусственным интеллектом. Насмешки сменились возмущением, когда истории о студентах, ложно обвиненных в мошенничестве из-за GPTZero, начали заполнять Reddit. В один момент родитель одного из таких студентов обратился к Сохейлу Фейзи, профессору компьютерных наук в Университете Мэриленда. "Они были действительно яростными", - сказал Фейзи. В прошлом году, до того как GPTZero дебютировал, Фейзи и некоторые его коллеги из Мэриленда начали готовить исследовательский проект о проблемах с детекторами искусственного интеллекта, которые, как он подозревал, могут быть ненадежными. Теперь GPTZero и его подражатели заставили его задуматься о том, что они могут причинить больше вреда, чем пользы.
Еще одной головной болью для Тяня стало количество хитрых студентов, находящих способы обойти детектор. Одна из персон на Twitter посоветовала пользователям вставлять нулевой пробел перед каждой буквой "е" в тексте, сгенерированном ChatGPT. Пользователь TikTok написал программу, которая обходила детекцию, заменяя определенные английские буквы на свои похожие на них кириллические аналоги. Другие начали прогонять свой текст через QuillBot, популярный инструмент для перефразировки. Тянь исправил эти уязвимости, но обходные пути продолжали появляться. Было только вопросом времени, когда кто-то создаст конкурирующий продукт - анти-детектор.
В НАЧАЛЕ МАРТА, студент первого курса Стэнфордского университета по имени Джозеф Семрай и его друзья ехали по автомобильной трассе Тихоокеанского побережья в Лос-Анджелес, когда они оказались запертыми в своей арендованной машине Zipcar в Вентуре. Они пошли в ближайшую кофейню Starbucks и ждали помощи на дороге. Но поскольку ожидание затянулось на несколько часов, Семрай и его друг задумались, как восстановить утраченное время. У Семрая было эссе, которое следовало сдать на следующей неделе по обязательному курсу письма для первокурсников. Это был его самый нелюбимый тип задания: формульное эссе, предназначенное для демонстрации логического мышления. "Это довольно алгоритмический процесс", - говорит Семрай.
ChatGPT было очевидным решением. Но на тот момент его ответы обычно ограничивались несколькими абзацами, поэтому написание эссе целиком требовало многократного выполнения нескольких шагов. Семрай хотел создать инструмент, который мог бы написать эссе за один приступ. Он также знал, что существует шанс, что это может быть обнаружено с помощью GPTZero. Поддерживаемый своим другом, Семрай достал свой ноутбук и разработал сценарий, который позволял бы писать эссе на основе указанной темы, запускать текст через GPTZero, а затем вносить изменения в фразировку, пока искусственный интеллект не становился недоступным для обнаружения - фактически использовал GPTZero против самого себя.
Semrai представил свою программу несколько дней спустя на дне демонстрации для друзей и семьи, своего рода шоу-телл для студенческого сообщества разработчиков в Стэнфорде. Стоя перед аудиторией своих одноклассников, он попросил аудиторию предложить тему для эссе — кто-то предложил "рестораны высокой кухни" в Калифорнии — и ввел ее в поле для ввода. Через несколько секунд программа выдала восьмипараграфное эссе, неоригинальное, но связное, с указанием источников. "Не говорю, что я бы когда-нибудь отправил эту работу", — сказал Семрай, вызывая смех. — "Но вот, пожалуйста. Я не знаю, экономит время". Он назвал инструмент WorkNinja и запустил его через два месяца в магазине приложений. С помощью рекламной кампании с участием влиятельного представителя поколения Z Дэвида Добрика и раздачи 10 Tesla пользователям, которые зарегистрировались, он получил более 350 000 загрузок в первую неделю; с тех пор количество регистраций замедлилось до нескольких сотен в день, по словам Семрая. (Семрай не стал указывать, кто финансировал кампанию, только что это был крупный ангел-инвестор из Силиконовой долины.)
20-летний Семрай с его Zoomer-видом и спокойным характером скрывает кипящую интенсивность. В то время как Тянь прыгает и волнуется в своем мире, Семрай кажется сосредоточенным и непроницаемым. 19-летний говорит уверенным тоном, готовым к подкасту, предприниматель из Силиконовой долины, который видит мир как проблемы, которые нужно решить, заканчивая каждое второе предложение со словами "Правильно?" Слушая его рассказы о защищенных заставах и "S-кривых" общественного роста, легко забыть, что ему нельзя законно пить. Но затем, время от времени, он скажет что-то, что выдает его глаза, раскрытого студента, открытого для мира и все еще пытающегося найти свое место в нем. Как-то раз он с другом гулял по причалу Санта-Моники до трех часов ночи, "говоря о том, что нам ценно". Семрай много думает о том, как найти баланс и счастье. "Я думаю, что, пока я молод, он, вероятно, больше заключается в исследовании производной", — говорит он, — "погоне за экстремумами".
Вырастая в Нью-Йорке, а затем во Флориде, его родители - пожарный отец из Йонкерса и домохозяйка-мать из Китая - дали ему длинный поводок. "Меня оставляли самому себе в детстве, чтобы заниматься тем, что меня действительно волнует", - сказал он. "Лучший способ сделать это было создавать что-то на компьютере". Когда Семрай было 6 лет, он создал плагин для назначения уровней доступа на сервера Minecraft, а в 7 лет написал программу, которая исправляла Windows 7, чтобы на нем можно было запустить Windows XP. "Мне просто счастливо от того, что могу создавать вещи для людей", - говорит он.
Его семья переехала из Квинса в Палм-Сити, когда ему было 9 лет, и Семрай увидел разницу между системами государственных школ. Основные навыки работы с компьютером, которые он считал само собой разумеющимися в школах Нью-Йорка, были редкостью во Флориде. Он начал писать программы, чтобы помочь заполнить пробелы в образовании - траектория, которая позволяет ему сказать, что он "работает в области образовательных технологий всю свою жизнь". В первый год старшей школы он создал онлайн-платформу обучения, которая выиграла стартап-финансирование на местном конкурсе. До пандемии он создал систему цифрового пропуска через коридор, которая стала основой для контактного трассирования и была принята 40 школьными округами на юго-востоке.
Semrai в основном является техно-оптимистом. Он считает, что мы должны ускорить развитие технологий, включая искусственный общий интеллект, потому что в конечном итоге это приведет нас к обществу "пост-дефицита" - мировоззрение, иногда описываемое как "эффективный акселерационизм" (не следует путать с эффективным альтруизмом, который утверждает, что мы должны предпринимать действия, которые максимизируют "хорошие" результаты, как бы они ни были определены). Аргументы Semrai в пользу WorkNinja основываются на своего рода акселерационистической логике. Инструменты искусственного интеллекта для написания хороши, по его мнению, не потому, что они помогают детям обманывать, а потому, что они заставят школы пересмотреть свои учебные планы. "Если вы можете следовать формуле для создания эссе, это, вероятно, не хорошее задание", - говорит он. Он представляет себе будущее, в котором каждый студент сможет получить образование, ранее зарезервированное для аристократов, благодаря персонализированному обучению с помощью искусственного интеллекта. Когда он только учился программировать, Semrai, говорит, что в основном полагался на видео на YouTube и интернет-форумы, чтобы получить ответы на свои вопросы. "Было бы проще, если бы был наставник, который бы меня руководил", - говорит он. Теперь, когда искусственные интеллектуальные наставники реальны, почему стоять у них на пути?
Джозеф Семрай, 19 лет, создатель WorkNinja, инструмента, который генерирует эссе, написанные искусственным интеллектом. ИЛЛЮСТРАЦИЯ: ДЖЕЙМС МАРШАЛЛ; ФОТОГРАФИЯ: ЧАРИС МОРГАН
Я НЕДАВНО ПОЛЬЗОВАЛСЯ WorkNinja для создания нескольких эссе, включая одно об эволюционной теории Дарвина. Первая версия, которую он мне дал, была неловкой и повторяющейся, но пригодной, исследующей последствия теории для биологии, генетики и философии. GPTZero отметил его как вероятно созданный искусственным интеллектом.
Поэтому я нажал кнопку "Перефразировать" в WorkNinja. Текст немного изменился, заменяя некоторые слова синонимами. После трех перефразировок GPTZero наконец-то дал тексту свою печать человечности. (Когда я повторно протестировал тот же текст через несколько недель, инструмент отметил его как смесь человеческого и искусственного интеллекта.) Проблема была в том, что многие перефразированные предложения больше не имели смысла. Например, следующее предложение:
Teория эволюции Дарвина - это идея того, что живые виды эволюционируют со временем из-за их взаимодействия с окружающей средой.
Teория эволюции Дарвина - это мысль о том, что живые виды приобретают со временем из-за их взаимодействия с окружающей средой.
По крайней мере, любому студенту, ищущему сокращение, придется отредактировать свой черновик WorkNinja перед отправкой. Но это указывает на реальную проблему: если даже этот несовершенный черновик может обойти детекторы, то что может сделать более прочный продукт?
В марте Сохейл Фейзи из Мэрилендского университета опубликовал свои результаты по результатам работы детекторов искусственного интеллекта. Он утверждал, что проблемы с точностью неизбежны из-за способа работы детекторов текста ИИ. По мере увеличения чувствительности инструмента для обнаружения большего количества текста, созданного искусственным интеллектом, невозможно избежать увеличения количества ложных срабатываний до неприемлемого уровня. Пока, по его словам, невозможно получить одно без другого. И по мере того, как статистическое распределение слов в тексте, созданном искусственным интеллектом, приближается к распределению слов у людей, то есть становится более убедительным, он говорит, что детекторы становятся менее точными. Он также обнаружил, что перефразирование сбивает с толку детекторы искусственного интеллекта, делая их суждения "почти случайными". "Я не думаю, что будущее блестяще для этих детекторов", - говорит Фейзи.
Тем временем, говорит он, детекторы наносят вред студентам. Допустим, у инструмента обнаружения есть 1 процент ложноположительных результатов - оптимистическое предположение. Это означает, что в аудитории из 100 студентов в течение 10 домашних эссе в среднем будет 10 студентов, которые ошибочно обвиняются в списывании. (Фейзи говорит, что приемлемой будет скорость одна к тысяче.) "Это смешно даже думать о том, чтобы использовать такие инструменты для контроля использования моделей искусственного интеллекта", - говорит он.
Тянь говорит, что цель GPTZero - не поймать жуликов, но фактически это был его основной случай использования до сих пор. (Результаты обнаружения GPTZero теперь идут с предупреждением: "Эти результаты не должны использоваться для наказания студентов".) Что касается точности, Тянь говорит, что текущий уровень GPTZero составляет 96 процентов при обучении на самом последнем наборе данных. Другие детекторы хвалятся более высокими показателями, но Тянь говорит, что это является сигналом тревоги, так как это означает, что они "подгоняют" данные обучения под преимущества своих инструментов. "Вы должны поставить ИИ и человека на равные позиции", - говорит он.
Удивительно, но искусственно сгенерированные изображения, видео и фрагменты аудио гораздо легче обнаружить, по крайней мере, на данный момент, чем синтетический текст. Компания Reality Defender, получившая поддержку от Y Combinator, была запущена в 2018 году с акцентом на обнаружение фальшивых изображений и видео и с тех пор расширилась на аудио и текст. Intel выпустила инструмент под названием FakeCatcher, который обнаруживает deepfake видео, анализируя узоры кровотока на лице, видимые только камерой. Компания Pindrop использует "биометрию" голоса для обнаружения поддельного аудио и аутентификации звонящих вместо вопросов о безопасности.
Искусственно-интеллектный сгенерированный текст сложнее обнаружить, потому что у него относительно небольшое количество данных для анализа, что означает меньше возможностей для отклонения вывода ИИ от человеческой нормы. Сравните это с FakeCatcher от Intel. Ильке Демир, исследователь-ученый в Intel, который также работал над фильмами Pixar, говорит, что создание достаточно большого и детализированного набора данных, позволяющего deepfaker'ам имитировать подписи кровотока для обмана детектора, было бы крайне сложно. Когда я спросил, можно ли в будущем создать что-то подобное, она сказала, что ее команда предвидит будущие разработки deepfake-технологий, чтобы опережать их.
Бен Колман, генеральный директор Reality Defender, говорит, что инструменты их обнаружения невозможно обойти, в частности, потому что они являются частными. (Пока клиентами компании являются в основном правительства и крупные корпорации.) С использованием общедоступных инструментов, таких как GPTZero, любой может пропустить текст через детектор и затем настроить его, пока он не будет проходить проверку. Напротив, Reality Defender проверяет каждого человека и учреждение, использующих инструмент, говорит Колман. Они также следят за подозрительным использованием, поэтому, если определенный аккаунт будет проводить тесты с одним и тем же изображением с целью обойти обнаружение, их система сигнализирует об этом.
В любом случае, подобно охотникам за спамом, шпионам, создателям вакцин, обманщикам в шахматах, конструкторам оружия и всей кибербезопасности в целом, детекторы искусственного интеллекта во всех средах будут постоянно приспосабливаться к новым методам уклонения. Предполагая, разумеется, что разница между человеком и машиной все еще имеет значение.
ЧЕМ БОЛЬШЕ ВРЕМЕНИ я проводил, разговаривая с Тяном, Семрай и их одноклассниками, тем больше я задавался вопросом: на самом ли деле эти молодые люди ... любят писать? "Да, очень!" - сказал Тиан, светящийся еще больше обычного, когда я спросил его в прошлом мае на кампусе Принстонского университета. "Это как головоломка". Ему нравится разгадывать, как слова сочетаются друг с другом, а затем упорядочивать идеи так, чтобы они логично следовали друг за другом. "Мне кажется, это забавно делать." Он также обожает процесс интервью, поскольку это дает ему "окно в жизнь людей, а также зеркало, отражающее, как ты живешь своей собственной".
В школе Тиан говорит, что писать было скучным делом. Он признается, что Макфи воспламенил его любовь и расширил его вкус. В июне он взволнованно рассказал мне, что только что купил буханку Анни Диллард «Жизнь писателя».
Семрай также находил задания по письму в школе скучными и механистическими - больше о синтезировании информации, чем о создании чего-то нового. "Я предпочел бы открытые задания, которые бы подстегнули творчество", - говорит он. Но он использовал эти навыки синтеза в работе. Во втором курсе он написал 800-страничную учебную книгу под названием «Создавай что угодно», предназначенную "взять человека, который ничего не знает, и научить его немножко обо всем" в веб-разработке. (Он самостоятельно опубликовал книгу на Amazon в 2022 году и продал несколько сот экземпляров). Семрай сказал, что это тот вид прозы, в котором ChatGPT сейчас преуспевает. "Я не думаю, что книга относится к категории значимого письма", - говорит он.
После почти 20 лет набора слов за деньги я могу сказать из опыта, что писать - это отстой. Спросите любого профессионального писателя, и он скажет вам, что это самое худшее, и это не становится легче со временем. Я подтверждаю, что энтузиазм и любопытство, необходимые для постоянного сканирования мира, выявления фактов и извлечения из них смысла, могут быть трудными для поддержания. И это еще до того, как учесть состояние отрасли: снижение ставок, уменьшение объема страниц и сокращение внимания (читателей и моего собственного). Я продолжаю это делать, потому что, хорошо или плохо, это теперь то, кто я есть. Я делаю это не для удовольствия, а потому что это кажется значимым - по крайней мере, для меня.
Некоторые писатели романтизируют борьбу. Макфи однажды описывал, как лежал на пикниковом столе две недели, пытаясь решить, как начать статью. "Статья в конечном итоге состояла из пяти тысяч предложений, но в течение этих двух недель я не мог написать ни одного", - писал он. Когда-то в 22 года он привязал себя к стулу для писания плотным поясом халата. По словам Томаса Манна, "Писатель - это тот, для кого писать сложнее, чем для других людей". "Вы ищете, ломаете сердце, спину, мозг, и только тогда - только тогда - вам это подарят", - пишет Энни Диллард в книге "Жизнь письма". Она делает этот вывод после долгого сравнения письма с борьбой с аллигатором.
Подразумевается, что чем сильнее сжатие, тем сладкий сок - что есть доблесть в противостоянии пустой странице, приручении ее, заставлении ее уступить место прозе. Так происходят великие прорывы, мы говорим себе. Агония стоит того, потому что именно так рождаются идеи.
Зов искусственного интеллекта говорит: "Может быть, это и не обязательно". И, задумавшись о миллиардах людей, находящихся вне клуба избранных писателей, начинаешь думать: "Может быть, так и не должно быть".
Мей Хабиб провела свое детство в Ливане, прежде чем переехать в Канаду, где она выучила английский как второй язык. "Мне казалось довольно несправедливым, что такая большая польза достается только тем, кто хорошо читает и пишет", - говорит она. В 2020 году она основала Writer, одну из нескольких гибридных платформ, которая не стремится заменить письменность человека, а помочь людям, и более точно брендам, лучше сотрудничать с искусственным интеллектом.
Хабиб считает, что есть ценность в пристальном взгляде на пустую страницу. Это помогает вам рассматривать и отбрасывать идеи и заставляет вас организовать свои мысли. "Есть так много преимуществ в бродяжничестве, взрывающем голову, когда хочется убить себя, глядя на курсор", - говорит она. "Но это нужно взвешивать на фоне скорости в миллисекундах".
Writer не призван писать за вас, говорит она, а скорее сделать ваше письмо быстрее, сильнее и последовательнее. Это может означать предложение правок в стилистике и структуре или выделение того, что еще было написано на тему и предложение контраргументов. Цель, говорит она, - помочь пользователям сосредоточиться меньше на механике предложений и больше на идеях, которые они пытаются выразить. Идеально, этот процесс приводит к созданию текста, который такой же "человеческий", как если бы его написал сам человек. "Если детектор может определить его как письмо искусственного интеллекта, то вы использовали инструменты неправильно", - говорит она.
Черно-белая идея о том, что писательство либо создают люди, либо искусственный интеллект, уже начинает сдавать позиции, говорит профессор Уортонской школы Университета Пенсильвании Итан Моллик. Вместо этого мы входим в эру того, что он называет "центавральным писательством". Конечно, просить ChatGPT составить эссе о истории Монгольской империи даст ожидаемые "ИИ-подобные" результаты, говорит он. Но "начните писать: 'Детали в третьем абзаце не совсем правильные - добавьте эту информацию и сделайте тон больше похожим на The New Yorker'", - говорит он. "Тогда это становится смешанным произведением и гораздо лучшим качеством писательства".
Моллик, преподающий предпринимательство в Уортоне, не только разрешает своим студентам использовать инструменты искусственного интеллекта - он требует этого. "Теперь в моей программе указано, что вы должны сделать хотя бы одно невозможное", - говорит он. Если студент не умеет программировать, может быть, он напишет работающую программу. Если он никогда не занимался дизайном, он может создать визуальный прототип. "Каждую работу, которую вы сдаёте, должны проверить как минимум четыре известных предпринимателя, которых вы имитируете", - говорит он.
Согласно Моллику, студенты всё равно должны освоить свою предметную область, чтобы добиться хороших результатов. Цель - научить их критическому и творческому мышлению: "Мне не важно, какой инструмент они используют, главное - чтобы они использовали его на высоком уровне и применяли свой разум".
Моллик признаёт, что ChatGPT не так хорош, как лучшие писатели-люди. Но он может помочь всем остальным. "Если вы были писателем в нижнем квартиле, то теперь вы находитесь на 60-70 процентиле", - говорит он. Это также избавляет определенные типы мыслителей от тирании процесса написания. "Мы приравниваем способность писать с интеллектом, но это не всегда так", - говорит он. "На самом деле, я бы сказал, что это часто не так".
Edward Tian, возраст 23 года, создатель GPTZero, инструмента, который обнаруживает тексты, созданные искусственным интеллектом. ИЛЛЮСТРАЦИЯ: ДЖЕЙМС МАРШАЛЛ; ФОТОГРАФИЯ: ЛОРИН ХИЛЛ
В БЕЗОБЛАЧНЫЙ день в мае Тянь и я прогуливались по кампусу Принстонского университета; огромные белые палатки для встреч казались приземлившимися на ухоженные газоны, словно космические корабли. По моей просьбе Тянь пригласил нескольких однокурсников пообедать с нами в китайском ресторане за пределами кампуса и поговорить о искусственном интеллекте.
В то время как некоторые учебные заведения спешили запретить использование ChatGPT, а генеральные директоры технологических компаний подписывали письма, предупреждая о грозящей опасности, студенты были заметно спокойны в отношении будущего, связанного с машинным интеллектом. (Принстон предоставил преподавателям возможность установить свои собственные правила.) Одна из них недавно использовала ChatGPT для написания благодарственной части своей диссертации. Другие, включая Тяня, полагались на него, чтобы заполнить части скрипта при написании кода. Лидия Ю, старшекурсница и студентка компьютерных наук, планирующая работать в журналистике, просила ChatGPT написать стихотворение о потерях в стиле Элизабет Бишоп - попытка воссоздать ее знаменитое стихотворение "Один искусство". ("Искусство потерь не трудно освоить.") Результат был "очень близким" к оригинальному стихотворению, - сказала Лидия, и она обнаружила, что чат-бот справился даже лучше: проанализировал оригинал и описал, что делает его таким трогательным. "Мы видели много паники почти по всему в нашей жизни", - сказала Лидия, ссылаясь на TikTok, Twitter и сам интернет. "Я чувствую, что люди нашего поколения, как будто говорят: Мы сами можем разобраться, как использовать это".
Софи Амитон, старшекурсница, изучающая механику и аэрокосмическую инженерию, включилась в разговор: "Кроме того, я считаю, что наше поколение во многих отношениях ленивее", - сказала она, и Лидия кивнула в знак согласия. "Я вижу, что сейчас гораздо больше людей, которые не хотят традиционных работ, не хотят работать с девяти до пяти".
"Они разочарованы", - сказала Лидия. "Многие работы - это таблицы".
"Я думаю, что это стало результатом Ковида", - продолжила Софи. "Люди переоценили смысл работы, и если можно использовать ChatGPT, чтобы сделать свою жизнь проще и, следовательно, иметь лучшее качество жизни или баланс между работой и личной жизнью, то почему бы не воспользоваться этим ярлыком?".
Лиз, недавно окончившая Принстон, предпочитала не использовать свою фамилию, прислала мне статью, которую она написала с помощью ChatGPT для курса по глобальной политике. Вместо того, чтобы просто попросить его ответить на вопрос эссе, она ввела план с подробными пунктами в виде маркеров, а затем попросила его написать статью на основе своих заметок. После длительного общения — указывая ему переписывать и переставлять, добавлять здесь нюансы и контекст там — у нее, наконец, была статья, с которой она чувствовала себя комфортно для отправки. Она получила А.
Я скопировал и вставил ее статью в GPTZero. Вердикт: "Ваш текст, скорее всего, написан полностью человеком."
В начале мая, всего несколько недель до того, как Тиан и его одноклассники наденут свои черные выпускные мантии, команда GPTZero выпустила разрабатываемое ими расширение для Chrome и назвала его Origin. Origin все еще является примитивным: вам нужно самостоятельно выбрать текст веб-страницы, и его точность не идеальна. Но Тиан надеется, что однажды это инструмент будет автоматически сканировать каждый просмотренный вами веб-сайт, выделяя контент, созданный ИИ — от текста до изображений и видео — а также все «токсичное» или фактически сомнительное. Он описывает Origin как «ветровое стекло» для информационной автострады, отражая бесполезный или вредный материал и позволяя нам ясно видеть дорогу.
Тиан был неутомимо оптимистичен по поводу компании; он также просто счастлив был получить работу, которую действительно хотел. Многие из его друзей планировали стать предпринимателями, поступая в Принстон, но сокращение расходов в технологическом секторе изменило их планы.
"Мы видели много паники почти по всему в нашей жизни. Я чувствую, что люди нашего поколения говорят себе: Мы сами разберемся, как это использовать."
Как студент второго курса со всего лишь тремя годами обучения в Стэнфорде, Семрай пришел к лету с более свободным настроем. В жаркий четверг послеобеденный час в июне, на крыше Pier 17 недалеко от Уолл-стрит, Семрай, в зеленой рубашке с узором и белых кроссовках Nike, ярко говорил со мной о будущем - или, по крайней мере, о следующих нескольких неделях. Его лето только начиналось. ("Я быстро тестирую свою диссертацию.") Но пока он был в Нью-Йорке, останавливаясь у друзей и работая над несколькими проектами на базе искусственного интеллекта. В предыдущую ночь он спал в рабочем пространстве в районе Сохо. А сейчас он стоял в затененной VIP-зоне мероприятия, организованного Techstars New York City, стартап-акселератором, пока сотни потных участников шатались в ярком свете.
Поблизости мэр Нью-Йорка Эрик Адамс стоял на сцене в авиаторах и полном костюме, восхваляя преимущества программирования. "Я технический специалист", - сказал Адамс, прежде чем призвать гостей искать разнообразных партнеров и использовать "исходный код" для решения общественных проблем, таких как рак и оружейное насилие. Затем он побудил одиноких в зале людей найти себе "коротышку или друга" и завязать с ними отношения.
Семрай подходил к созданию своих проектов с принципом "посмотрим, что пригодится". Помимо WorkNinja, он разрабатывал платформу для чат-ботов на основе настоящих знаменитостей, обученных по огромному объему их данных, с которыми поклонники могли бы взаимодействовать. Он также создавал прототип браслета, который бы записывал все, что мы говорим и делаем - Семрай называет это "идеальной памятью" - и предлагал в режиме реального времени советы для облегчения разговоров. (Группа однокурсников в Стэнфорде недавно создала похожий продукт под названием RizzGPT, очки, которые помогают своему владельцу флиртовать.)
Он ожидал, что лето приведет к взрыву приложений на базе искусственного интеллекта, поскольку молодые программисты будут смешиваться и перекрещиваться. (Эрик Адамс одобрил бы.) "Я думаю, что появится созвездие стартапов, и через пять лет мы сможем провести линии между людьми - начало экосистемы", - сказал он.
Летом Тиан имел команду из 12 сотрудников и собрал 3,5 миллиона долларов от нескольких венчурных капиталистов, включая Джека Альтмана (брата генерального директора OpenAI Сэма Альтмана) и Эмада Мостака из Stability AI. Но в ходе наших разговоров я заметил, что его представление о GPTZero/Origin немного меняется. Теперь он говорит, что AI-детекция будет только одной из частей набора средств для проверки человечности. Так же важным будет акцент на происхождении, или "данных о контенте". Идея заключается в том, чтобы прикрепить к контенту криптографическую метку, подтверждающую, что он был создан человеком, определяемым его процессом создания - своего рода captcha для цифровых файлов. Adobe Photoshop уже прикрепляет метку к фотографиям, созданным с помощью его нового инструмента генерации AI Firefly. Любой, кто смотрит на изображение, может щелкнуть правой кнопкой мыши и увидеть, кто его создал, где и как. Тиан говорит, что он хочет сделать то же самое для текста и что он обсуждал это с инициативой по аутентификации контента - консорциумом, посвященным созданию стандартов происхождения в медиа, а также с компанией Microsoft о возможном сотрудничестве.
Можно интерпретировать акцент на происхождение как неявное признание того, что одной только детекции недостаточно. (OpenAI закрыла свой текстовый классификатор в июле из-за низкой точности.) Это также предвидит возможный парадигмальный сдвиг в нашем отношении к цифровым медиа. Вся затея детекции предполагает, что люди оставляют неподдельную подпись в тексте - что-то воспринимаемое - подобно тому, как полиграф предполагает, что нечестность оставляет объективный след. Происхождение основано на чем-то вроде этикетки "Сделано в Америке". Без этой этикетки мы бы не знали разницы. Это тонкое, но значимое различие: Человеческое письмо может быть не лучше, не более творческим и даже не более оригинальным. Но оно будет человеческим, что будет иметь значение для других людей.
В июне команда Тиана сделала еще один шаг в сторону практичности. Он рассказал мне, что они разрабатывают новую платформу для написания под названием HumanPrint, которая поможет пользователям улучшить их AI-написанный текст и даст возможность поделиться "доказательством подлинности". Но не путем генерации текста. Она будет использовать технологию GPTZero, чтобы выделить секции текста, которые недостаточно человеческие, и попросить пользователя переписать их своими словами - своего рода инверсия текущих помощников по написанию AI. "Так учителя могут указать, что, возможно, более 50 процентов эссе должно быть написано своими словами", - сказал он. Когда я спросил, является ли это поворотом для компании, Тиан утверждал, что это "естественное развитие детекции". "Всегда была задача быть золотым стандартом ответственного использования искусственного интеллекта", - сказал Тиан, - "и это остается". Однако, ясно подразумевается: Нельзя остановить AI-написание; единственный вариант - работать с ним.
"У меня действительно нет очень хорошей идеи", - сказал Макфи мне по телефону. "Но если бы я догадывался, то это значит, что мои произведения раскрывают науку, или сельское хозяйство, или авиацию, или что бы там ни было, через людей. Всегда есть центральный персонаж, от которого я учусь". Действительно, Макфи пишет глазами экспертов. Читатель не только получает некоторые эзотерические знания о геологии, частицовой физике или апельсинах, но и чувствует человека, изучающего предмет, а также Макфи, изучающего этого человека.