January 21

Ончейн-аналитика. Linea airdrop. Изучаем сибилл

Перевод

Это вольный перевод статьи: research.nansen.ai/articles/linea-airdrop-sybil-detection.

Коротко

Я крайне негативно отношусь к сибиллам, поскольку они рушат саму идею децентрализации. Но лишь негативное/плохое к ним отношение - ничего не решит. Поэтому проекты вынуждены использовать разные методики, которые, порой, отрицательно сказываются на нормальных участниках комьюнити.

Чего греха таить: Orbiter, HYPE и ряд проектов поменьше - отрезали меня от раздачи по весьма и весьма туманным основаниям. Но такова реальность. Поэтому - изучаем.

Введение

Для обеспечения честности и прозрачности в процессе определения права на участие в airdrop от Linea мы провели детальный анализ для выявления Sybil-адресов среди всех кошельков с ненулевым балансом LXP.

Эта инициатива была направлена на выявление и удаление «нечестных» кошельков, созданных исключительно для «эксплуатации системы». Наша цель — вознаградить настоящих пользователей и членов сообщества, уделяя особое внимание точности и открытости.

Наш процесс

Мы применили многоэтапный, основанный на данных подход для выявления и исключения Sybil-адресов, сохранив при этом учёт настоящих пользователей.

Linea провела начальную проверку личности для пользователей, завершивших определённые ончейн-активности для получения токенов LXP и прошедших аттестацию Proof of Humanity (PoH).

В результате для анализа у нас было 1,297,203 уникальных EVM-адреса.

Ключевые результаты

На первом этапе мы пометили 50.45% адресов как Sybil, что составляет 654,443 уникальных адреса.

Среди них были небольшие операции, такие как кошельки «casual farmers», и другие тесно связанные адреса.

Учитывая, что большинство пользователей имеют несколько кошельков и используют их для различных целей, мы решили не наказывать за «здоровую» ончейн-активность с использованием нескольких кошельков.

Мы повысили пороги и смягчили ограничения, чтобы сфокусироваться на более крупных и автоматизированных Sybil-операциях. Мы допустили наличие небольших операций, но сосредоточились на крупных Sybil-сетях, обычно включающих около 20 связанных кошельков (хотя это не строгий (критерий оценки)).

В итоге, результаты … следующие:

  • Всего адресов проверено: 1,297,203 уникальных EVM-адреса;
  • Обнаружено Sybil-адресов: 516,960;
  • Процент Sybil-адресов: 39.85%;
  • Оставшиеся допустимые адреса: 780,243.

Процесс отсеивания

Мы использовали многоэтапный подход, основанный на (сырых) данных, чтобы выявить и удалить Sybil-адреса, сохраняя при этом учёт подлинных пользователей.

Первичное сканирование

Состоит из:

  1. Кластерный анализ: Для начального формирования кластеров был использован высокоуровневый ончейн-анализ.
  2. Результат (по кластеризации): Были выявлены начальные кластеры потенциально связанных кошельков.

Поведенческий анализ

Если адрес «выглядит и действует» как Sybil-адрес на основе ончейн-активности, есть высокая вероятность, что он действительно является Sybil. Поведенческий анализ помогает определить и отслеживать такие закономерности.

Мы провели детальный анализ, используя данные, специфичные для Linea, а также более широкие межсетевые точки (взаимодействия). Этот (процесс) включал изучение моделей активности кошельков, истории транзакций, контрагентов и других аспектов.

Другими словами, модель выявила кошельки, поведение которых совпадало, что, скорее всего, указывает на автоматизацию или высокую степень корреляции, основанную на их ончейн-активности.

Чтобы исключить ложные (срабатывания), мы сосредоточились на выявлении скоординированного, автоматизированного поведения в пределах кластеров, сохраняя высокую степень сходства (чем выше сходство, тем более коррелированное поведение между парами адресов).

Мы установили высокий порог, чтобы отдать предпочтение точности, а не охвату.

Ручная проверка выборки

Состоит из 2 этапов:

  1. Валидация: Случайная выборка кластеров для проверки точности выявленных поведенческих паттернов и соответствия нашим целям поощрения реальных пользователей.
  2. Результат по валидации: Были внесены окончательные корректировки для уменьшения числа ложноположительных результатов и подтверждения Sybil-адресов.

Примеры Sybil-адресов

Чтобы продемонстрировать, как выглядят высоко коррелированные адреса на ончейне, ниже приведен примерный набор адресов. Это адреса с очень высокими показателями сходства, имеющие множество пересекающихся контекстов (ончейн-связей):

Можем наблюдать: практически идентичное распределение активов в сети, наряду с аналогичным транзакционным поведением на Linea (учитывая данные о контрагентах, значениях, временных метках, действиях (методах) и других межсетевых данных, не отраженных на скриншотах).

Заключение

Благодаря тщательному анализу и сотрудничеству с командой Linea, мы выявили и исключили Sybil-адреса из первоначального списка претендентов, сократив его с 1,297,203 до 780,243 допустимых адресов.

Наш процесс был ориентирован на высокую точность, чтобы минимизировать ложные срабатывания (результаты) и вознаградить реальных пользователей.

Хотя наша методология является собственностью компании, процесс был разработан таким образом, чтобы быть комплексным и масштабируемым.

Мы стремились снизить риск несправедливого исключения настоящих пользователей, используя обширные метки, покрытия и AI-модели Nansen для кластеризации адресов с аналогичными ончейн-признаками.

Эта инициатива соответствует обязательству Linea обеспечивать прозрачность и справедливость при вознаграждении реальных пользователей через ончейн-кампании и усилия Proof of Humanity.

Мы надеемся, что данный отчёт проливает свет на наш подход.

Если вы считаете, что ваш кошелек был ошибочно помечен (как сибилла), команда Linea создала портал для подачи возражений. Каждый случай будет рассмотрен максимально тщательно.

До!