Оракулы рынков предсказаний на основе ИИ // Перевод статьи
Перевод подготовлен каналом «С нуля до нуля на крипте» Оригинал: https://x.com/omeragoldberg/status/1836067673278734443?t=BYd49-ZfBf2x0eJIQklhJw&s=09
Новая эра оракулов для рынков предсказаний
Рынки предсказаний, такие как те, что связаны с выборами в США, меняют наше восприятие реальных событий. В @chaos_labs мы рады объявить о запуске Edge Proofs Oracles.
@wintermute_t, ведущая глобальная фирма по алгоритмической торговле, выбрала Edge Proofs Oracles для обеспечения точности данных на OutcomeMarket, их новом рынке предсказаний президентских выборов в США.
Рынок будет использовать оракулы Edge Proofs от Chaos Labs для гарантии максимальной точности доставки данных через несколько блокчейнов.
Оракулы Edge Proofs обеспечивают проверяемое происхождение данных, их целостность и подлинность, позволяя блокчейн-приложениям доверять внешним данным, на которые они опираются. Эта возможность критически важна для оракулов рынков предсказаний (Prediction Market Oracles)— специализированного типа доказательных оракулов, предназначенных для безопасного и надежного переноса данных из офф-чейн в он-чейн, что гарантирует точную проверку реальных событий, таких как выборы.
Механизм работы Prediction Market Oracles следующий:
- Определение авторитетных источников: Надежные источники, такие как Associated Press, CNN или Fox, назначаются заранее. Эти источники служат основой для определения событий на рынке предсказаний, например, для определения победителя на выборах в США.
- Доказательство происхождения, целостности и подлинности данных: оракул гарантирует, что данные остаются в своем оригинальном виде, не подвергнуты изменениям и точно соответствуют тому, что было опубликовано указанными источниками, тем самым сохраняя целостность входящих данных.
- Определение результата события: продвинутые модели ИИ или большие языковые модели (LLM) обрабатывают текст и генерируют выводы, отвечая на конкретные вопросы, такие как «Кто победил на выборах в США?», без внесения субъективных интерпретаций.
- Достижение консенсуса: для обеспечения надежности результата сеть оракулов достигает консенсуса между несколькими узлами. Этот шаг гарантирует, что ни одно отдельное лицо не может единолично определить исход события, обеспечивая прозрачность и децентрализацию.
Важно отметить, что оракулы рынков предсказаний не выступают в роли арбитров истины, а гарантируют использование проверенных источников данных и прозрачных методов для определения результатов. Такой подход предоставляет масштабируемое, децентрализованное решение, минимизируя человеческую предвзятость и возможность вмешательства.
Этот пост погружается в ключевые вызовы, с которыми сталкиваются рынки предсказаний, — доказательство происхождения данных и проверка их точности, — и как оракулы Edge Proofs решают эти задачи с помощью ИИ, таких как LLM. Давайте рассмотрим эти вызовы и наш подход к их решению.
Почему проверка происхождения данных важна как никогда
Происхождение данных — это возможность отследить и проверить их источник и историю. В децентрализованных системах обеспечение подлинности означает, что данные поступили из доверенного источника и не были изменены во время передачи.
Для блокчейн-приложений, особенно таких, как рынки предсказаний, точность входящих данных напрямую влияет на результаты. Если источник данных не поддается проверке или данные были подделаны, это может привести к неточностям или финансовым последствиям. Гарантия того, что происхождение и подлинность данных могут быть криптографически проверены, жизненно важна для поддержания доверия к децентрализованным системам.
Мы находимся в кризисе доверия
Мы переживаем кризис доверия; мы больше не знаем, кому можно доверять, и не имеем четкого представления о том, откуда берутся данные и насколько они надежны.
С повышением доступности генеративного ИИ и больших языковых моделей (LLM) стоимость создания высококачественного поддельного контента стремится к нулю, что затрудняет возможность отличать факты от вымысла. Теперь мошенническая информация может быть создана, изменена или удалена с минимальными усилиями, подрывая доверие в цифровом пространстве.
Chaos Labs напрямую решает эту проблему с помощью оракула Edge Proofs для рынков предсказаний, который будет использоваться на Outcome Market — рынке предсказаний президентских выборов в США 2024 года от Wintermute. Проверка подлинности и происхождения данных является важнейшим условием не только для принятия решений людьми, но и для работы автономных агентов и децентрализованных систем. Эти системы зависят от данных, происхождение и целостность которых не могут быть проверены третьими сторонами с помощью текущих протоколов, таких как HTTPS.
Проверяемые данные — это не просто теоретическая проблема, а критический вопрос в мире, который все больше зависит от доверия, где ненадежная информация становится более распространенной, чем когда-либо.
Опасность ревизионизма
Изменчивость интернета создает возможность для ревизионизма. Опубликованный контент может быть незаметно изменен или удален, не оставляя следов исходного материала. Сайты и публикации могут изменять факты своих репортажей без какой-либо ответственности, что приводит к утрате целостности и росту недоверия общества к СМИ.
Нет канонической неизменной записи того, что было опубликовано, и никакая система не гарантирует, что фрагмент информации останется в том виде, в каком он была изначально размещен.
Люди подрывают доверие
Такие инициативы, как Wayback Machine, стремятся сохранить записи интернета, фиксируя снимки веб-сайтов и сохраняя их содержимое даже в случае изменений или удаления. Это помогает решать такие проблемы, как архивирование веб-истории и удаление информации.
Однако эта система неидеальна. Некоторые страницы не фиксируются из-за исключений (например, файла robots.txt), система плохо справляется с динамическим контентом (сгенерированным с помощью JavaScript) и ограничена ресурсами, что означает, что она не может архивировать все. Проблемы с серверами и редкие сканирования также могут приводить к пробелам в записях.
Несмотря на эти ограничения, это ценный ресурс для сохранения веб-истории.
Кроме того, как мы увидим ниже, раскрытие правды может быть крайне сложным. Мигранты с Гаити едят домашних животных в Спрингфилде? США подделали высадку на Луну?
Определение результатов события
В настоящее время определение результатов события на рынках предсказаний часто осуществляется вручную. Участники или централизованные организации анализируют доступные данные, оценивают источники и голосуют или объявляют результаты на основе своих интерпретаций. Этот ручной процесс, хотя и прост, создает возможность для человеческих предубеждений, конфликтующих стимулов и субъективных трактовок.
Использование больших языковых моделей (LLM), таких как GPT, для рынков предсказаний предлагает более эффективную альтернативу. Когда им задаются четкие и узко определенные задачи — например, ответить, победил ли кандидат A или B на выборах, основываясь на «жестких новостях», — LLM прекрасно справляются с обработкой данных быстро и последовательно. Например, LLM может обрабатывать фактический новостной контент, опубликованный доверенными источниками, такими как CNN или Associated Press, чтобы предоставить четкие и точные ответы, такие как подтверждение победителя на выборах после официального объявления результатов вышеупомянутыми изданиями.
Однако важно, чтобы запросы на рынке предсказаний были четкими и недвусмысленными. Плохо сформулированные запросы могут вызвать путаницу, как это произошло на рынке предсказаний выборов в Венесуэле 2024 года на Polymarket. Вопрос заключался в том, что считать «официальной информацией» из Венесуэлы и что подразумевается под «консенсусом достоверных репортажей». Отсутствие четкости позволило множественные трактовки, создавая неопределенность как для моделей ИИ, так и для человеческих участников. Для того чтобы LLM могли надежно определять результаты, необходимы четкие правила и хорошо сформулированные задачи, сводящие к минимуму потенциальную двусмысленность.
Исследование: работа оракула на рынке предсказаний выборов в Венесуэле 2024 года
Рынок предсказаний выборов в Венесуэле 2024 года на Polymarket стал ярким примером сложности разрешения реальных событий на децентрализованных рынках предсказаний. По мере того как участники делали ставки на результат, рынок перешел от отражения прогнозов к активному формированию нарратива, что показало, насколько трудно установить истину в напряженных политических ситуациях.
Изначально рынок склонялся к победе Николаса Мадуро, что подтверждалось официальными результатами выборов от Национального избирательного совета Венесуэлы (CNE). Однако на этом история не закончилась. Оппозиция отказалась признать поражение, заявив о своей победе и предоставив собственные данные в поддержку этих утверждений.
Это создало атмосферу сильнейшей неопределенности, когда противоречивые нарративы затрудняли определение реального результата событий. В центре разрешения этого рынка оказался протокол UMA — оптимистичный оракул, основанный на человеческом вмешательстве, который и определял исход рынка. Участники голосования UMA должны были принять решение посреди хаоса, выбирая между официальными данными, представленными правительством Венесуэлы, и цифровым контрнарративом оппозиции. В конечном итоге UMA принял решение в пользу кандидата от оппозиции, Гонсалеса, несмотря на глобальный консенсус в пользу Мадуро. Это решение выявило важную проблему: когда результат рынка предсказаний зависит от оракула, он перестает быть пассивным ретранслятором фактов и становится могущественным арбитром истины.
Эта ситуация демонстрирует огромную сложность разрешения реальных событий в децентрализованных системах, особенно в условиях политических споров. Оракулы, такие как UMA, полагаются на человеческие решения, что порождает вопросы о манипуляциях, предвзятости и централизации власти. Участники торгов и наблюдатели задавались вопросом, действительно ли оракул просто зафиксировал исход или же сам вынес решение.
Рынок предсказаний выборов в Венесуэле на Polymarket выявил сложную проблему: как двусмысленность формулировки запроса на рынке предсказаний может привести к путанице среди голосующих и оставить место для манипуляций. В данном случае критерии разрешения рынка — «официальная информация из Венесуэлы» и «консенсус достоверных репортажей» — были нечеткими. Эта неопределенность вынудила как голосующих, так и оракулы трактовать, что считать «достоверными репортажами», что привело к разным мнениям и потенциальной возможности для манипуляций. Роль оракула, изначально предназначенного для наблюдения и разрешения, стала ключевым фактором, формирующим сам рынок.
Эта ситуация подчеркивает трудности в разрешении рынков предсказаний с человеческим вмешательством в неопределенных или спорных условиях, что еще больше усложняет идею нейтральности. В Chaos Labs мы учли эти уроки при разработке оракула Edge Proofs для рынка предсказаний президентских выборов в США 2024 года. Наш подход использует LLM для устранения человеческой предвзятости, снижая риски централизации, манипуляций и субъективных решений. Однако четкие запросы и понятные правила остаются ключевыми для сохранения целостности и справедливости рынков предсказаний.
Оракулы рынков предсказаний, основанные на LLM
Использование проверяемых моделей машинного обучения для решений оракулов предоставляет преимущества по сравнению с системами голосования, основанными на человеческом участии, особенно в условиях, где доверие, точность и эффективность имеют первостепенное значение.
Устранение человеческого фактора и обеспечение точности с помощью моделей, основанных на данных
Системы, управляемые людьми, подвержены предвзятости, вызванной личными убеждениями, политическими взглядами или финансовыми интересами. На рынках предсказаний это создает риск манипулирования или искажения результатов. Эмоции, такие как страх или жадность, могут дополнительно влиять на решения, особенно когда ставки высоки, а объективность критически важна.
Напротив, модели машинного обучения обрабатывают данные систематически в соответствии с заранее установленными правилами. Хотя такие модели не полностью свободны от предвзятости — их результаты зависят от качества и разнообразия обучающих данных — их можно тщательно тестировать и совершенствовать. Модели машинного обучения, обученные на достоверных данных, предлагают более структурированный подход, который минимизирует внешнее влияние и способствует объективности и справедливости.
Кроме того, способность тестировать, проверять и улучшать модели машинного обучения делает их особенно эффективными в достижении стабильных результатов, особенно в таких задачах, как проверка итогов выборов на основе данных из надежных источников. В отличие от систем, управляемых людьми, которые могут по-разному интерпретировать данные, модели машинного обучения следуют одинаковой логике и выдают повторяемые результаты при одинаковых вводных данных. Этот структурированный подход, основанный на данных, является ключом к обеспечению точности и надежности при разрешении событий на рынках предсказаний.
Проверяемость и прозрачность
В человеческих системах сложно отследить логику, лежащую в основе каждого голоса или решения. Даже если результаты можно проверить, понять мотивы решений часто затруднительно, что подрывает доверие.
Наоборот, модели машинного обучения полностью проверяемы. Обучающие данные, параметры модели и процессы вывода могут быть проверены, что делает процесс принятия решений прозрачным. Каждый прогноз можно отследить до исходных данных, что позволяет третьим сторонам с ясностью и уверенностью проверять результаты.
Скорость, масштабируемость и автоматизация
Модели машинного обучения обладают высокой масштабируемостью и способны обрабатывать огромные объемы данных в режиме реального времени. В то время как системы, управляемые людьми, требуют времени на обсуждение, координацию и медленные процессы голосования, модели машинного обучения выдают результаты практически мгновенно, что делает их идеальными для сред, требующих скорости и эффективности.
Кроме того, оракулы на основе машинного обучения (ML) могут быть автоматизированы. Они не требуют человеческого вмешательства на каждом этапе, что значительно снижает операционные затраты и увеличивает пропускную способность. Независимо от того, обрабатывают ли они большие объемы транзакций или сложные данные из множества источников, модели машинного обучения могут работать автономно, не теряя при этом точности.
Устойчивость к манипуляциям на рынке
Системы голосования, управляемые людьми, подвержены манипуляциям, особенно когда участники имеют значительные финансовые интересы в результате. Крупные участники рынка могут пытаться влиять на результаты через давление или финансовые стимулы, что вызывает существенные проблемы доверия — особенно в децентрализованных системах.
Модели машинного обучения, напротив, устойчивы к таким манипуляциям. Эти модели принимают решения на основе предопределенной логики и данных, а не внешнего давления или стимулов. Поскольку они сами не участвуют в рынках и не имеют финансовых интересов, они свободны от конфликтов интересов. Исключая людей из процесса принятия решений, модели машинного обучения значительно снижают риск фальсификации или неправомерного влияния, обеспечивая объективность и надежность рынков предсказаний.
Так являются ли LLM панацеей?
Хотя LLM обладают большим потенциалом, они не являются универсальным решением. Важно признать их ограничения. Один из недавних примеров — модель Google Gemini, которая в некоторых случаях переписывала части истории США, что подчеркивает, что LLM могут иногда выдавать ошибочные или неточные ответы.
Эти недостатки проистекают из предвзятости в обучающих данных и присущей языковым моделям вариативности.
Тем не менее, когда речь идет об оракулах на рынке предсказаний, которые требуют простого извлечения ответов из четко определенных и авторитетных источников — например, о выявлении победителя выборов на основе статей уважаемых новостных агентств, таких как CNN или Associated Press, — мы считаем, что LLM могут быть весьма эффективными. Ключевым моментом является сосредоточение модели на простых задачах, связанных с фактологическими, утвердительными заявлениями. Например, когда CNN публикует статью, объявляющую победителя выборов, задача LLM — просто извлечь явное утверждение о победителе и ничего более.
Этот контролируемый, узконаправленный подход минимизирует сложности, которые обычно вызывают вариативность в выводах LLM. Модель не просит интерпретировать или взвешивать субъективные данные; она просто извлекает четкие факты. Такая простота помогает свести к минимуму возможные ошибки, которые могут возникнуть в более абстрактных или открытых задачах.
Однако мы не питаем иллюзий о совершенстве LLM. Эти модели продолжают быстро развиваться,, и каждая итерация приносит улучшения в способности рассуждать и общем интеллекте. Как пионеры в области оракулов предсказаний на основе LLM, Chaos Labs применяет осторожный и методичный подход. Мы внедряем механизмы защиты и контроля, чтобы обеспечить безопасное, надежное и прозрачное использование технологии, пока она продолжает развиваться. Признавая текущие ограничения и готовясь к стремительным будущим улучшениям, мы уверены, что LLM будут играть значительную роль в будущем децентрализованных рынков предсказаний.
Что дальше?
В ближайшие дни и недели мы выпустим серию технических подробных обзоров нашего подхода к решению ключевых задач верификации происхождения данных, их подлинности и определения результатов с использованием LLM. Эти обзоры подробно разберут механизмы, лежащие в основе Edge Proofs Oracles, и объяснят, как мы обеспечиваем доверие к офф-чейн данным, переносимым в он-чейн. Мы шаг за шагом пройдемся по криптографическим механизмам доказательства, которые мы используем для проверки источника и целостности внешних данных, а также расскажем о дизайнерских решениях, которые позволяют нам использовать технологии LLM для извлечения результатов на рынках предсказаний. Оставайтесь с нами!
Перевод подготовлен каналом «С нуля до нуля на крипте»Оригинал: https://x.com/omeragoldberg/status/1836067673278734443?t=BYd49-ZfBf2x0eJIQklhJw&s=09