January 15
How to DYOR in AI services 2025?
TG CHANNEL: @g0ds_plan_og
Google Sheets "Агрегатор" инструментов: https://docs.google.com/spreadsheets/d/1sEdnQZdaqjE02XRhW5-UnBJ4X2Cg6156dG4WEyerhZk/edit?gid=2134803399#gid=2134803399
Итакс, тут буду вести список сервисов для сравнения AI, и публиковать другие полезные ссылки, связанные с AI сектором.
Лидерборды для сравнения крупных языковых моделей (LLM):
- Hugging Face Open LLM Leaderboard - Это популярный ресурс, где открытые модели языкового моделирования оцениваются по различным бенчмаркам. Сайт предлагает детальную информацию о производительности моделей.
- Artificial Analysis LLM Leaderboard - Предоставляет сравнение и ранжирование API-провайдеров и моделей по ключевым метрикам, таким как цена, скорость вывода, задержка и размер контекстного окна.
- LMSYS Chatbot Arena - Платформа, где можно сравнить различные LLM через анонимные, случайные баттлы, основанные на человеческих предпочтениях.
- SEAL LLM Leaderboards - Разработанные Scale AI, эти лидерборды предлагают экспертную оценку и регулярное обновление рангов моделей на основе частных наборов данных для обеспечения объективности.
- Vellum AI LLM Leaderboard 2024 - Фокусируется на сравнении как коммерческих, так и открытых источников LLM по их возможностям, цене и размеру контекстного окна на основе данных из технических отчетов.
- Klu LLM Leaderboard - Упор на метрики производительности, ранги и инсайты для исследователей и разработчиков AI, обновляемый в реальном времени.
- Chatbot Arena от OpenLM.ai - Использует краудсорсинг для оценки моделей через сравнение ответов, с использованием рейтинга Elo для ранжирования.
- Lmarena.ai - Ссылку дал один крутой поц с DS (data science), отсюда и взял модельку Deepseek (также по его совету).