Yupp: сравнивайте ИИ-модели, выбирайте лучшую и получайте результат! Оценка команды, концепта, коина, кода + практики
Конечно проект вряд ли удастся использовать для вайдкодинга или OpenClaw ассистента (нет API), но для задач в веб интерфейсе - вполне.
Решил написать аналитику, так как последнее время периодически использую, когда нужно получить ответ от двух моделей. Например, можно сравнить ответы Chat GPT 5.2 и Claude Sonnet 4.6.
Аудит
Команда
Что сразу понравилось, на сайте есть и LinkedIn, и фотографии команды в соответствующем разделе.
Интересный факт: страницу в LinkedIn отслеживают 4 тысячи человек.
А последняя публикация на омент написания статьи - 6 часов назад.
В разделе "Люди" 61 участник команды (круто). Но со ссылками из них лишь 16. Хотя по сравнению со многими другими проектами - тоже отлично!
Одного я исключил из списка - он руководит инженерным отделом в Индии. Про остальных - ниже.
Pankaj Gupta - Cofounder and CEO Yupp. Ранее - Vice President Of Engineering в Coinbase, до этого - Director Of Engineering и Senior Director Of Engineering в Google Pay. Также был Sr. Staff ML Engineer в Twitter, и CEO в Halli Labs / Agara Labs. Образование - PhD в Stanford University и B.Tech в IIT Delhi. По уровню компаний и техническому треку это очень сильный руководитель с реальным опытом управления сложными ML/продуктовыми командами.
Gilad Mishne - AI Lead в Yupp. Ранее - Senior Engineering Manager в Google, Engineering/ML Lead в X (the moonshot factory), и работа в Arcadia Science. Образование - PhD Computer Science и M.Sc Computer Science в Universiteit van Amsterdam, также B.A Computer Science в Technion. Это очень сильный AI-профиль, особенно за счёт специализации на information retrieval и опыта управления ML-направлениями в крупных компаниях.
Kanav Mehra - AI Engineer в Yupp. Ранее - Lead Data Scientist и Senior Data Scientist в Beatdapp, до этого - Graduate Researcher в University of Waterloo, ещё раньше - Technology Consultant в PwC India. Образование - Master of Mathematics (Computer Science, Thesis) в University of Waterloo, а также BTech в IIEST Shibpur. Профиль выглядит профессионально за счёт исследовательского бэкграунда и практического опыта в data science.
Tian Wang - Software Engineer в Yupp. Ранее - Senior Engineering Manager в DoorDash, до этого - инженерные роли в Twitter и Google. Образование - B.E в Tsinghua University и M.S в UNC Chapel Hill. Это очень сильный инженерный профиль уровня senior/lead, с опытом в high-load продуктах и крупных инфраструктурных системах.
Pratik Kumar - AI Engineer в Yupp. Ранее - Data Scientist II и III в Flipkart, также был Assistant Manager в Citi, и стажировка в Mentor Graphics. Образование - MTech в IIT Madras и магистратура в Georgia Tech. Профиль выглядит как сильный прикладной ML/NLP-инженер с хорошей академической базой и опытом в крупных компаниях.
Lily Ge - AI Engineer в Yupp (contract part-time). Также - Undergraduate Research Assistant в University of Waterloo и Machine Learning Engineer в WAT.ai. Образование - Bachelor of Software Engineering в University of Waterloo (2024-2029). Для своего этапа карьеры это сильный профиль, потому что сочетает research и практическую ML-разработку.
Shyam A - Product Manager в Yupp. Ранее - Software Engineer в Microsoft, также стажировки в Microsoft и Tricog Health. Образование - Bachelor's degree Computer Science в RV College Of Engineering. Профиль выглядит как продакт с инженерным фундаментом и опытом в крупной технологической компании.
Matthew Nicholas - Head of Design в Yupp. Ранее - Design Systems Lead в Ripple, Venmo.com Design Systems Lead в PayPal, Lead Product Designer в Facebook. Также в опыте указаны Dropbox, Square и Eventbrite. Образование - Bachelor's degree в Claremont McKenna College. Это сильный senior-дизайнер с фокусом на дизайн-системы и продуктовые интерфейсы в крупных компаниях.
James Gu - Director of Business Development and Operations в Yupp. Ранее - Partnerships + M&A Lead в Scale AI, Director of Partnerships в Centific, а также Strategy & Corporate Development в SurveyMonkey. В описании также упоминаются L.E.K. Consulting и PepsiCo. Образование - BS в Boston College (Finance, Marketing, Philosophy). Это сильный бизнес-профиль с прямым опытом партнёрств в AI-индустрии.
Lakshya Malu - Growth and Partnerships в Yupp. Ранее - Senior Manager, International Growth в Snap Inc., также был VP, Strategic Partnerships в Lynk Global. Образование - Boston University и Stanford Ignite (Stanford GSB). Это сильный growth-специалист с опытом масштабирования продуктов в крупных компаниях.
Chandramouli Gopalakrishnan, Ph.D - Product в Yupp. Ранее - Principal PM Manager в Microsoft, Vice President (Special Projects) в ixigo, и Consultant в SpiceJet Limited. Образование - M.S и PhD Computer Science and Engineering в University of South Florida, плюс BE CSE в University of Madras. Это очень сильный продуктовый профиль уровня senior, с серьёзной технической базой и опытом в Microsoft.
Thanuj Punjabi - Recruiter в Yupp. Ранее - Talent Acquisition в Ola и Amazon, HRBP в Exotel, и Principal Consultant в theHRpuzzle. Образование - B.E в Sri Bhagwan Mahaveer Jain College of Engineering. Профиль выглядит как опытный рекрутер с практикой найма в крупных компаниях.
Aria Aulia - Community Manager в Yupp. Ранее - Marketing Designer Supervisor в Titan Corporation Indonesia, а также Executive Coordinator в Sahabat MKAA. Образование - International Relations and Affairs в Universitas Pasundan. Профиль выглядит как практик по коммьюнити и маркетинговым задачам, с опытом в креативных и координационных ролях.
Soumya Vijayan - Executive Assistant в Yupp. Ранее - Business Operations Manager и Technical Project Manager в ZoomInfo, Operations Manager в Insent, и Virtual Assistant в Wishup. Образование - B.Tech в University of Kerala. Это сильный операционный профиль, с опытом координации процессов и управления административными задачами в технологической среде.
Margaret Corvid - Community and Socials в Yupp (contract). Также - Content Strategist в gm3 Group и Consultant в Lorepunk Labs. По опыту это профиль контент- и коммьюнити-специалиста, ориентированного на ведение коммуникаций и социальных каналов.
Соцсети проекта
Начну с блога:
Посты редки - 2 месяца назад последний. Но и публикуют раз в 1-3 месяца примерно.
X @yupp_ai активен. У них 2 520 постов и 25.9 тысяч читателей:
Последний пост был 18 часов назад с 33 ответами, 32 репостами и 72 лайками. Это хороший результат.
Предыдущий был 16 февраля (2 дня назад) с 10 ответами, 8 репостами и 46 лайками - меньше, но тоже норм (особенно соотношение ответов, репостов и лайков).
По данным Moni, score у проекта
Discord тоже активен. Сообщество и команда отзывчивые. Быстро отвечали на мои вопросы и сообщения о багах.
Отреагировали и на мою информацию о плохой доступности анбординга (там была карточка, которую надо было раскрыть для продолжения).
Если подробнее, вот скрин моего фидбека и ответов команды:
Они даже тикет сделали с благодарностью и просьбой сообщить e-mail для баллов! Вот скрин:
Сегодня в анонсах в 1:51 опубликовали про Sonnet 4.6:
В Chat общаются (последнее сообщение было 10 минут назад):
В канале, где делятся постами "│show-and-tell", тоже активно публикуют - несколько раз в день:
В общем, один из самых дружелюбных и активных проектов!
Итог по команде
Оценка 5 из 5: публичны и являются профессионалами (есть ссылка на LinkedIn), Соцсети активные. на вопросы отвечают и корректно. Радует, что дадут мне поинты за фидбек по доступности!
Концепт
Использовал ИИ-модели для поиска, так как сам не нашёл бы: нет конкретного раздела с документацией. Есть лишь разбросанная инфа.
О проекте
Yupp — это инновационная платформа-агрегатор ИИ-моделей, запущенная в июне 2025 года [1]. Проект ставит своей миссией расширение возможностей человечества по формированию будущего ИИ через систему краудсорсингового сбора данных и обратной связи [1].
- Every AI for everyone: Предоставление бесплатного доступа к более чем 800 топовым моделям ИИ (включая Claude 4 Opus, GPT-5.2, Gemini 3) в одном интерфейсе [1] [3].
- Side-by-side Comparison: Пользователи получают ответы от нескольких моделей одновременно, сравнивают их и оставляют отзывы [1].
- Yupp Credits: Система внутренних баллов, которые пользователи тратят на использование мощных моделей и зарабатывают, предоставляя качественную обратную связь [1].
Технические подробности
Проект фокусируется на решении проблемы "модельных эвалов" (model evals) — объективной оценки качества ИИ-моделей [2].
- VIBE Score (Vibe Intelligence BEnchmark): Собственная метрика рейтинга моделей, основанная на агрегированных предпочтениях миллионов пользователей в реальных сценариях использования, а не на статических тестах [2]. Это снижает ценность "натренированных под тест" бенчмарков.
Метрика строится на попарных сравнениях ответов моделей (side-by-side voting).
По сути, платформа превращает пользовательские предпочтения в структурированный датасет, который может использоваться как сигнал качества для разработчиков моделей. - Help Me Choose (HMC): Функция "AI peer review", где модели ИИ анализируют и критикуют ответы друг друга, помогая пользователю синтезировать информацию [4].
- Криптографическая интеграция: Использование блокчейнов Base (Ethereum L2) и Solana для обеспечения прозрачности, аутентичности и мгновенных выплат вознаграждений в стейблкоинах [1].
Важно: интеграция блокчейна здесь выглядит утилитарно - она используется как платежная инфраструктура для быстрых и дешевых трансграничных выплат (Cash Out), а не как самоцель. - Privacy-preserving analytics: Сбор данных о предпочтениях с сохранением конфиденциальности пользователей [1].
Дорожная карта и развитие
Проект прошел стадию закрытого тестирования (стелс-режим) в конце 2024 — начале 2025 года и официально запустился в июне 2025 года [1].
- Beta-версия Leaderboard: Запуск открытого рейтинга моделей на основе VIBE Score [2].
- SVG Leaderboard: Специализированный рейтинг моделей по способности генерировать векторную графику (SVG) [3].
- Масштабирование: Переход от текстовых моделей к мультимодальным (изображения, код, видео) [1].
- Глобальный стандарт: Стремление стать индустриальным стандартом для оценки ИИ через децентрализованные протоколы [1].
Анализ спроса и конкурентов
- Существует огромная потребность в объективной оценке ИИ, так как статические бенчмарки (MMLU и др.) быстро устаревают и подвержены "загрязнению" данными обучения [2].
- Пользователи ищут единую точку доступа к многообразию моделей без необходимости подписки на каждую в отдельности [1].
Конкурентное позиционирование:
- В отличие от LMSYS Chatbot Arena, Yupp делает ставку на потребительский продукт с системой стимулов (credits/cash out), криптографической прозрачностью и встроенной платежной инфраструктурой [1].
Экономика и вознаграждения
В отличие от многих платформ, Yupp внедрил прямую монетизацию вклада пользователей.
feedback -> credits -> доступ к моделям -> cash out
Это сильная часть продукта, и она делает Yupp ближе к "рынку оценки моделей", а не просто к чат-агрегатору.
- Cash Out: Пользователи могут конвертировать заработанные кредиты в реальные деньги (USD, Euro и др.) через Stripe и PayPal или в стейблкоины через Base и Solana [1].
- B2B потенциал: Агрегированные данные о предпочтениях представляют огромную ценность для разработчиков моделей (AI builders) для улучшения систем через RLHF (Reinforcement Learning from Human Feedback) [1].
- Стейблкоины: Интеграция с блокчейнами позволяет осуществлять трансграничные микроплатежи без комиссий [1].
Источники
[1] Introducing Yupp - Official Launch Blog
[2] Yupp AI VIBE Score and Leaderboard (Beta) - Technical Blog
[3] Yupp.ai - Official Website & SVG Leaderboard
[4] Introducing Help Me Choose - Product Feature Blog
[5] About Yupp - Mission and Team
Риски (моё мнение)
- качество датасета зависит от качества пользователей
- Финансовые стимулы могут привести к спаму, фарму и попыткам манипулировать предпочтениями (например, через ботов или массовое координированное участие).
- Даже при заявленном фокусе на приватность, это централизованный сервис, поэтому чувствительную информацию лучше не вводить.
- Платформа зависит от внешних провайдеров моделей и их API/ценовой политики, поэтому доступность некоторых моделей и стоимость credits могут меняться со временем.
Итог по концепту
Оценка 3 из 5: нет официальной документации. Пришлось пользоваться ИИ-моделями Manus, Parallel и Chat GPT для сверки.
Есть технические подробности, но они больше продуктовые, чем протокольные. Проект централизованный - это минус. Но концепт интересный: проект уникальный, и даже я пользуюсь для некритичных данных
Коин
Токеномики нет, как и токена. В прочем, он и не планируется.
По данным Cryptorank, проект собрал 33 МЛН от Andreessen Horowitz (a16z crypto), Coinbase Ventures, Gokul Rajaram, Kunal Shah, Jeff Dean, Aravind Srinivas, Balaji Prabhakar, Chris Re, Dan Boneh, Evan Sharp, Nick McKeown и Othman Laraki:
Список впечатляющий. Есть и известные.
Итог по коину
Оценка 3 из 5: по данным Cryptorank, инвестиции 33 МЛН $ в том числе от известных фондов. Например, Andreessen Horowitz (a16z crypto), Coinbase Ventures (всего 33). Но токеномики и ютилити токена будущего нет. Неизвестно вообще, будет ли он.
Хорошо, что есть уже рабочая экономика. Минус - она построена на раздаче вознаграждений (credits, конвертируемых в деньги), то есть на постоянном предложении. При этом мне неизвестен устойчивый источник спроса или выручки, который бы балансировал эти выплаты.
Код
Оценка 1 из 5: он закрыт. Организация на Github с похожим логином есть, но пустая и без ссылки на сайт yupp.ai.
Практика
Заходим на сайт. В первый раз у вас будет анбординг. Там вам покажут, что надо написать промпт и выбрать лучшую модель. Как сделаете это, необходимо раскрыть карточку, получить награду и перейти на главную - попадёте на страницу с новым чатом:
Я уже раскрыл панель со списком чатом - также будет и у вас. Это кнопка "Toggle Sidebar".
Нажав над "Refer for rewards", можем скопировать ссылку. Моя: https://yupp.ai/join/mammoth-silver-scooter
Буду рад регистрации по ней, если она на этой недели ещё доступна (даётся 5 приглашений в неделю).
Нажав по имени, открываем меню:
Тут ссылка на профиль, количество кредитов и функция вывода. У меня написано: "Cash out is not enabled". Как будет активен, можно будет нажать "Cash Out" и вывести.
На странице профиля можно подключить / изменить Discord, посмотреть статистику и удалить аккаунт.
На всякий случай вот профиль без сайдбара (вдруг с ним невидно страницу):
Вот так выглядит изменение профиля (edit profile):
С введением закончили - перейдём к основному функционалу.
Пишем запрос, выбираем модели и сравниваем ответы
Можно, конечно, оставить без выбора - тогда сервис выберет случайно. Но интереснее делать это самому.
Их реально много! Можно выбрать Reasoning:
И выбираю GPT 5.2. После этого кнопка заменится на "Add model" - кликаю по ней и ищу в поиске Sonnet:
По кнопке "Auto" можно выбрать между auto, text, images, html и svg. Показывать не буду (думаю и так понятно).
"Private" - просто статус чата (публичный или приватный).
"Attach files" - прикрепление файла. Но форматов мало: только изображения и PDF. Непонятно, почему хотя бы txt и js не поддерживают...
Конвертировал через печать в браузере, и добавил:
"Send message" и ждём. По окончании будет видно 2 ответа.
Выбираем модель, ответ которой больше подходит, и кликаем по "I prefer this" соответствующей кнопки.
Я выбираю вторую (справа) - Claude sonnet 4.6, отмечаю параметры оценки (почему одна лучше, а вторая хуже) и пишу текст:
Написано, что я получил 768 кредитов. Кликаю "Reveal reward":
Опять, блин, "Scratch card. Scratch to reveal your reward."! Напишу им - пусть исправляют.
А иначе мне сложно получать их.
Попробовал код для анбординга - не сработал...
Кстати, заметьте, что ниже идут варианты дальнейшего общения.
Итог по практике
Оценка 4 из 5: удобный, функциональный и полезный интерфейс. Много раз ответы помогали. Но вот получить награды мне незрячему невозможно: требуют после "Reveal reward" сделать "Scratch card", а это мне недоступно. Код от Chat GPT для выполнения действия из анбординга не подошёл...
Общий итог
- Команда: 5 из 5: публичны и являются профессионалами (есть ссылка на LinkedIn), Соцсети активные. на вопросы отвечают и корректно. Радует, что дадут мне поинты за фидбек по доступности!
- Концепт: 3 из 5: нет официальной документации. Пришлось пользоваться ИИ-моделями Manus, Parallel и Chat GPT для сверки.
Есть технические подробности, но они больше продуктовые, чем протокольные. Проект централизованный - это минус. Но концепт интересный: проект уникальный, и даже я пользуюсь для некритичных данных - Коин: 3 из 5: по данным Cryptorank, инвестиции 33 МЛН $ в том числе от известных фондов. Например, Andreessen Horowitz (a16z crypto), Coinbase Ventures (всего 33). Но токеномики и ютилити токена будущего нет. Неизвестно вообще, будет ли он.
Хорошо, что есть уже рабочая экономика. Минус - она построена на раздаче вознаграждений (credits, конвертируемых в деньги), то есть на постоянном предложении. При этом мне неизвестен устойчивый источник спроса или выручки, который бы балансировал эти выплаты. - Код: 1 из 5. Он закрыт.
- Практика: 4 из 5: удобный, функциональный и полезный интерфейс. Много раз ответы помогали. Но вот получить награды мне незрячему невозможно: требуют после "Reveal reward" сделать "Scratch card", а это мне недоступно. Код от Chat GPT для выполнения действия из анбординга не подошёл...
Всего: 16 из 25. Получше, чем у других. Но когда исправят доступность интерфейса полностью, будет уже 17 из 25. Надеюсь, это произойдёт скоро.
С вами был незрячий программист и автор обзоров
Подписывайтесь на https://t.me/blind_dev - там новые посты с аналитикой проектов и новости по моим разработкам.