Где можно початиться с ИИ
Ссылок пост для тг-канала Нейрокухня Доловара
В бурно развивающемся мире нейросетей всё быстро меняется, но для ориентирования в этом мире иногда полезно переписать известное. Сейчас речь пойдет про текстовые нейронки, которые LLM. Причем с упором на общедоступное и бесплатное. Порядок в списке даю не по удобству или частоте использования, а скорее по истории развития. И начну с широко известной пятерки.
https://chatgpt.com/
https://openai.com/
https://platform.openai.com/playground/prompts (платное)
Бренд *ChatGPT* от OpenAI (US). За последние пять лет выходили модели: GPT-3, GPT-3.5, GPT-4, мультимодальная GPT-4o, шустрая 4o-mini, рассуждающие o1, o3-mini, o3-mini-high, затем GPT-4.5 для исследований, несколько 4.1, o3, o4-mini, o4-mini-high - порядок нумерации не отражает последовательность разработки. Если упростить:
- 4o и 4o-mini для повседневных нужд окончательно заменили нашумевшую несколько лет назад 3.5 и поумневшую 4 (буква "o" после имени всегда указывает на мультимодальность),
- тестируемые сейчас 4.1, 4.1-mini и 4.1-nano могут подвинуть 4o и хвастаются контекстным окном в миллион токенов (бесплатно не будет),
- o3 сменила o1 и тугодумную o1-pro на посту рассуждающих (буква "о" перед цифрами всегда указывает на режим рассуждений перед ответом),
- новенькие рассуждающие o4-mini немного уступают o3, но превосходят и заменяют o3-mini на посту оптимизированных,
- стареющая задумчивая и дорогущая 4.5 недолго, но еще будет актуальна для тщательных исследований (Deep Research).
Сказанное выше о версиях потеряет актуальность в течение нескольких месяцев, можно не запоминать.
Кто-то считает OpenAI лидером рынка, технологий, непререкаемым авторитетом и лучшим из визионеров. Но я предпочитаю откидывать шумиху и смотреть на факты. Не лидер рынка, а глубоко убыточное предприятие, которое остается на плаву лишь благодаря постоянному притоку инвестиций извне. Не самый популярный сервис, китайцев не обойти по числу пользователей. Не лидер технологий, не самые продвинутые модели, хоть и держится в топе лучших. И не лучшие по соотношению цены к качеству. Их главная заслуга - доказательство возможности, породившее волну. Пионеры они, вот за это им спасибо. Сейчас активно работают над библиотеками для оркестрации агентов, чтобы заменять людей в длинном ряде профессий (и людям пора пугаться).
Мне они запомнились тем, что их генератор картинок (Dalle-e) был способен учитывать множество параметров из промпта. Конкуренты, к сожалению, откидывали половину инструкций (сейчас уже не актуально, многие рисовалки улучшились). Сейчас рисовалку доработали так, что она почти без ошибок переносит на картинку русские тексты, можно комиксы рисовать, но наметились проблемы со сложными промптами.
ЧатЖпт также запомнился тем, что у них самые жадные лимиты на бесплатные запросы, слишком быстро отказываются продолжать беседу "на максималках". Особенно жалко, что не получается полноценно использовать инструмент холста, лимита хватает лишь на несколько правок. И даже на тарифе Pro не доступны некоторые инструменты, например транскрибация аудио. И еще одна характерная черта - под видом новостей дается слишком много заявлений и обещаний (поддержание хайпа необходимо для привлечения инвестиций), избыток пустозвонства.
*Доступно бесплатно*: веб-интерфейс и мобильное приложение, редактирование текста на отдельном холсте (Canvas), поиск в интернете, рассуждающая модель, загрузка картинок и файлов для анализа, создание картинок (мультимодальная 4o), возможность управлять запоминаемой информацией о пользователе (Custom instructions и Memories).
*Не доступно бесплатно*: выбор конкретной модели, преднастраиваемые агенты (GPTs), папки для организации чатов (projects), запланированные запросы (tasks), генерация видео (Sora), доступ нейронки к вашим документам на гугл-диске, доступ по API, голосовой чат, расширенные функции рассуждающих моделей.
*Рекомендация к использованию*: окончательная полировка текстов, редкое проведение серьезных исследований, редкое создание простых иллюстраций.
https://claude.ai/
https://www.anthropic.com/
https://console.anthropic.com/
Семейство моделей *Claude* от Anthropic (US). В версиях 3.5 и 3.7 нужно смотреть на имена: быстрый и простоватый Haiku, умница Sonnet, крутой Opus.
Часть разработчиков из OpenAI из-за разногласий ушли и создали конкурирующую фирму, которая быстро добилась впечатляющих результатов. Sonnet и сейчас считается лучшим из облачных вариантов для программирования и написания текстов. Они же являются авторами Model Context Protocol (MCP), который позволяет расширять контекст запроса данными со своих серверов.
Из-за проблем с вычислительными ресурсами иногда в бесплатном доступе вместо умницы Сонета появляется глуповатый Хайку. Нет поиска в интернете, поэтому модных функций DeepSearch или DeepResearch (вдумчивый поиск в интернете) пока не предвидится (но на платном тарифе уже виднеется какой-то beta-Research). Также пока не видно возможности управлять преднастраиваемыми агентами, потому что акцент компании поставлен на развитии API, а не на веб-интерфейсных плюшках - предоставляют инструменты, а не решения.
*Доступно бесплатно*: веб-интерфейс и мобильное приложение, выдача кода в отдельных окнах (artifacts), загрузка картинок и файлов для анализа.
*Не доступно бесплатно*: выбор конкретной модели, папки для организации чатов (projects), доступ к данным из гугл-сервисов, доступ по API, расширенные функции рассуждающих моделей.
*Рекомендация к использованию*: умный собеседник для сложных вопросов, написание простых программ.
https://grok.com/
https://x.ai/
Семейство моделей *Grok* от xAI (US), последняя версия 3.
Еще один отколовшийся от OpenAI конкурент. Илону Маску не понравилось то, что OpenAI совсем не open, поэтому он создал новенький дата-центр (Colossus) и старается бесплатно давать то, на чем соседи пытаются зарабатывать, причем с минимумом цензуры и лимитов. Долгое время Grok был доступен только в пределах соц.сети X (бывший Twitter), но внезапно вышел в качестве отдельного сервиса и сразу попал в списки топов.
*Доступно бесплатно*: веб-интерфейс и мобильное приложение, загрузка картинок, файлов и урлов для анализа (также интеграция с Google Drive), генератор изображений (Aurora), голосовой чат (пока только на английском), режим рассуждений и DeepSearch (с небольшими ограничениями на частоту запросов), Grok Studio с холстом и исполнением кода.
*Не доступно бесплатно*: доступ по API, режим рассуждений и DeepSearch с последней более умной моделью, расширение фич и лимитов в Grok Studio.
*Рекомендация к использованию*: повседневное использование.
https://gemini.google.com/
https://aistudio.google.com/prompts/new_chat
https://notebooklm.google.com/?hl=ru
https://labs.google/
Семейство моделей *Gemini*, LearnLM, Gemma и так далее от Google (US).
Разумеется, монстр Гугла не мог остаться в стороне и немедленно попытался оседлать волну, создав свои LLM, причем не только облачные, но и локально запускаемые (о них расскажу как-нибудь в другой раз). И даже на телефонах с Андроидом предложил заменить программу Ассистента на чат с Gemini (и поэтому мой ассистент разучился ставить будильники, пофиксили через несколько месяцев). Из-за того, что пустячные запросы к ассистенту попадают в общую историю чатов, пришлось эту историю отключить. Как и в случае OpenAI и Anthropic на политические темы лучше не общаться, поскольку предвзятость зашкаливает до полной потери смыслов (в обучающей базе было слишком много западных газет).
Основное преимущество гугловских сервисов - хорошее быстродействие, и практически отсутствуют лимиты, можно гонять в хвост и в гриву. Ну и API вроде как самое дешевое из западных, есть даже возможность бесплатного подключения (для некоммерческого использования и не во всех странах, но достаточно для тестов в ходе разработки).
Главный недостаток - модели слишком своевольные, плохо следуют сценариям сложных промптов (разве что Gemini 1.5 Pro показывает прогресс). И в ответах избыток постороннего - приветствия, предложения продолжить общение на сторонние темы, не взирая на попытки запретить это инструкциями в промптах.
Возможность ознакомиться с новейшими моделями предоставляется на отдельной платформе Google AI Studio - там есть и более умные версии, и варианты с поддержкой огромного контекста. И с дополнительными возможностями, например - сбегай на ютуб по ссылке и перескажи содержание видео.
Также можно заглянуть в сервис NotebookLM - обсуждение черновиков, создание выжимок, аудиопересказы и другие функции. И можно заглянуть в другие AI проекты Google Labs (если ваша страна в списке допущенных).
*Доступно бесплатно*: веб-интерфейс и мобильное приложение, создание преднастроенных агентов (Gems или Gem-боты), загрузка картинок и файлов для анализа (есть доступ к гугл-диску), генерация картинок с возможностью внесения изменений (Imagen 3), голосовой чат (в AIStudio и в приложении), доступ по API (!!!), режим рассуждений и DeepResearch, холст (canvas, пока сыровато).
*Не доступно бесплатно*: доступ по API (расширенные лимиты), интеграция с гугл-сервисами, генерация видео (Veo), режим рассуждений и DeepResearch с последними более умными моделями.
*Рекомендация к использованию*: повседневное использование, дефолтный выбор для подавляющего большинства мелких вопросов.
https://chat.mistral.ai/chat/
https://mistral.ai/
https://console.mistral.ai/
Сервисы Le Chat и Le Platform представляют семейство моделей *Mistral*, Mixtral, Ministral, Pixtral, Codestral, Mathstral и их производных от Mistral (FR).
Европейцы озаботились поднятием своего стартапа, чтобы разбавить доминирование Штатов, и французы первыми реализовали хорошее семейство моделей для разных задач - от больших облачных до миниатюрных локальных. Поначалу их модели не отличались сообразительностью, но сейчас они вполне конкурентоспособны для несложных задач.
Еще в прошлом 2024 году Мистраль давала два существенных преимущества - отсутствие лимитов и огромные окна для ввода и вывода. Сделать подробный пересказ текстовой расшифровки двухчасового видео - на это был способен только ЛеЧат, прочие отказывались. По мере роста популярности платформы из-за возросшей нагрузки французы добавили лимиты на ежедневное использование, но и сейчас их сервисы остаются привлекательными. И наиболее важным преимуществом сейчас являются возможность бесплатно использовать преднастроенные агенты и даже облачный API - не для всех моделей и с ограничениями, но этого достаточно для отладки при разработке своих сервисов.
*Доступно бесплатно*: веб-интерфейс и мобильное приложение, загрузка картинок и файлов для анализа, веб-поиск (плюс отдельная функция "flash answers" с кешированием наиболее частых запросов), генерация изображений (Flux Pro), холст (Canvas, слабее чем у OpenAI), интерпретатор кода (артефакты с кодом и результатами), доступ по API (!!!).
*Не доступно бесплатно*: доступ к продвинутым моделям, отсутствие лимитов на количество запросов.
*Рекомендация к использованию*: повседневное использование, особенно для пересказов больших текстов (summarize).
NB: Главный недостаток упомянутой выше "большой пятерки" - шаткое экономическое положение, они опасно балансируют на грани банкротства, каждый из этих гигантов может внезапно уйти в прошлое, оставив следы лишь в истории (разве что Гугл "Too Big to Fail"). Еще один серьезный недостаток - по политическим и экономическим причинам отказываются работать с рядом стран (я не рекламирую VPN), кажется из вышеперечисленных только Мистраль в этом отношении более интернациональный, за что ему еще один плюс.
*GigaChat* от Сбера: https://giga.chat/ (нужен ID банка)
*YaGPT* и Алиса от Яндекса: https://alice.yandex.ru/ (сломана регистрация через гугл) https://shedevrum.ai/
По техническим причинам не могу самостоятельно протестировать большие модели из РФ. По обзорам я вижу, что они активно развивают свои модели и интерфейсные плюшки для них, и для простых запросов их уже можно использовать. Да, пока эти модели уступают "большой пятерке" в сложных задачах, но если честно - так ли уж сложны ваши повседневные задачи и запросы? При выборе ориентируйтесь не на синтетические тесты, а на простоту доступа и свои настоящие потребности, в которых обычно не решение мудрёных головоломок, а бытовые вопросы: получение справок и советов; перевод, пересказ и улучшение текстов; вытаскивание текста из аудио, видео, картинок - для подобного не нужны именно чемпионы соревнований.
ГигаЧат улучшают в основном для работы с цифрами, но встречаются и забавные фичи вроде "переписать под зумеров, бумеров, миллениалов". Плюс рисовалка вполне достойная среди бесплатных (Kandinsky). Доступно также в Телеграме и по API, подходит и для автоматизации (N8N, make.com). Алиса же удобна не столько колонкой, сколько встроенными функциями в я-браузере и мобильном приложении.
*Рекомендация к использованию*: повседневное использование в тех странах, где западные LLM недоступны без ухищрений.
Бренд *DeepSeek* от одноименной компании (CN) с моделями DeepSeek-V3 и рассуждающей DeepThink-R1.
Хедж-фонд High-Flyer для игр на бирже создал большой вычислительный кластер, который решил дополнительно использовать для разработки ИИ. Создали подразделение DeepSeek, в которое взяли на работу молодых специалистов, которые успешно решили задачу "догнать и перегнать на ограниченных ресурсах". Это не стартап, а вполне устойчивая компания, которая больше года успешно конкурировала с технологическими гигантами Китая, а к началу 20025 года вышла на международный рынок, заставив и западных конкурентов пересматривать подходы и цены.
Вполне умные модели умеют проводить исследования с подтягиванием данных из Интернета, реализовав один из первых бесплатных веб-сайтов с функцией DeepResearch. Следует помнить, что доступ к некоторым сайтами из Китая может быть ограничен. Также внимания заслуживает тот факт, что в базу знаний модели попали политические установки из обучающих текстов и контролеров, склонных к западным же нарративам, то есть модели получились отнюдь не "коммунистические".
Главным недостатком является то, что сервис старательно атаковали во время стартовой шумихи, поэтому сайт регулярно отказывался выполнять запросы (сейчас с этим полегче).
Также при использовании локальных дистиллятов следует понимать, что они больше взяли от базы, чем от моделей DeepSeek, и прежде всего это касается устаревших базовых знаний.
*Доступно бесплатно*: веб-интерфейс и мобильное приложение, загрузка картинок и файлов для анализа, веб-поиск, переключение на рассуждающую модель.
*Не доступно бесплатно*: доступ по API (цены в числе наиболее низких на рынке), в веб-интерфейсе расширение лимитов, приоритетная обработка, мультимодальные функции, интеграция с бизнес-системами.
*Рекомендация к использованию*: повседневное использование.
Бренд *Qwen* от компании Alibaba Cloud, которая является частью гиганта Alibaba Group (CN). Свежие модели: большое семейство локальных Qwen2.5, Qwen2.5-1M с большим окном контекста, мультимодальная Qwen-VL, умеющая чатиться Qwen2.5-Omni, большие Qwen-Max и Qwen-Plus.
Специализируются на разработке ИИ более пяти лет, вложили немало средств и достигли впечатляющих результатов. Раньше их знали по локальным моделям qwen, которые были вполне умны и быстры, а недавно таки сделали веб-сайт с публичным и бесплатным доступом, что сразу же подняло известность и популярность.
*Доступно бесплатно*: веб-интерфейс, веб-поиск, переключение на рассуждающую модель, загрузка файлов, картинок, аудио и видео для анализа, создание изображений и видео, артефакты.
*Не доступно бесплатно*: доступ по API, в веб-интерфейсе расширение лимитов.
*Рекомендация к использованию*: повседневное использование.
https://minimax.io/
https://chat.minimax.io/
Бренд *MiniMax* от стартапа Hailuo AI (CN) представляет модели MiniMax-Text-01 для обычного использования и MiniMax-01 для обработки длинных контекстов (CN), мультимедийные Hailuo Vision, Hailuo Video, Hailuo Audio.
Изначально стартап работал над генерацией изображений и видео, но недавно открыл публичный сайт и для доступа к своим LLM. Модели выглядят не самыми умными (это активно правится), веб-интерфейс простоват, но бесплатное и без ограничений по странам заслуживает внимания.
*Доступно бесплатно*: веб-интерфейс и мобильное приложение, веб-поиск, загрузка файлов и картинок для анализа, создание изображений, аудио и видео.
*Не доступно бесплатно*: доступ по API, в веб-интерфейсе расширение лимитов.
*Рекомендация к использованию*: повседневное использование для простых запросов и мультимедийных задач.
Бренд *Kimi* AI от стартапа Moonshot AI (CN) дает доступ к единственной, но мультимедийной и рассуждающей модели Kimi 1.5
Еще один пример публично доступной возможности чатиться с нейронкой.
*Доступно бесплатно*: веб-интерфейс и мобильное приложение, веб-поиск, переключение в режим рассуждений, загрузка файлов и картинок для анализа.
*Не доступно бесплатно*: доступ по API, в веб-интерфейсе расширение лимитов.
*Рекомендация к использованию*: повседневное использование, особенно для больших контекстов.
А теперь упомяну тех, кто известен, но не попал в список лучших из облачных LLM с бесплатным доступом:
Сервис *Perplexity* AI от одноименной компании (US).
Бесплатный доступ к модели, основанной на Sonar LLM (собственная разработка с элементами GPT). Специализируется на веб-поиске с генерацией ответов, то есть не традиционный чат, а скорее попытка создать умный поисковый сервер на замену Гуглу. Есть возможность фильтровать источники: веб, научные работы, социальные сети.
Сервис успел обрести популярность, но из-за очевидности идеи быстро уступает позицию гигантам, которые тоже поспешили реализовать веб-поиск, и сделали это лучше. Модель от Перплексити была откровенно глуповата, и сервис без возможности чата с обсуждением не был достаточно удобным, чтобы составить длительную конкуренцию на рынке. В последнее время Перплексити предоставляет возможность переключиться на модели "большой пятерки", но перспективы так себе.
https://copilot.microsoft.com/
Проект *Copilot* от Microsoft (US).
Поначалу сотрудничал с OpenAI, но затем поработали над своими LLM (Prometheus, Phi-4), однако для сложных функций по-прежнему используют большие LLM от "большой пятерки".
Тесно интегрированы в MS Office и другие MS продукты.
Причина малой популярности - бесплатная версия слишком сильно урезана по уму и лимитам на запросы. Однако порисовать простые картинки можно и сейчас.
Основные усилия MS направляет на реализацию того, что доступно по платным подпискам в продуктах MS.
https://ai.meta.com/
https://www.meta.ai/
https://www.llama.com/
Семейство моделей *Llama* от Meta AI, подразделения Meta Platforms (US).
Вы вряд ли будете использовать чат на родном веб-сайте - он не доступен без VPN и meta-аккаунта "правильной" страны.
Кстати, компания находится под судебным разбирательством, поскольку кое-кто спиратил миллионы книг и личных переписок для обучения своих моделей.
Также стоит упомянуть, что в некоторых странах данная компания считается причастной к причастных к терроризму и экстремизму.
Но мы любим их не за это.
Мета создают модели с открытым кодом и широкой лицензией, которые можно скачать себе и использовать почти без ограничений. Упомяну некоторые:
llama 3.1 была одной из первых, которые работали быстро, послушно, а еще хорошо говорили по-русски (и на множестве других языков).
llama 3.2 стала мультимодальной.
llama 3.3 весом в 70b по уму почти догнала облачных собратьев.
llama 4 обрела огромное окно контекста и прочие улучшения.
NB: Полезнейший и популярный сервис ollama для запуска локальных моделей не связан с Meta, разрабатывается совсем другими людьми.
Добавлю в список несколько агрегаторов:
https://huggingface.co/
HuggingChat от Hugging Face - позволяет протестировать множество моделей, хранящихся в этом огромном архиве.
https://dewiar.com/
DEWIAR - эксперименты в автоматизации и не только.
https://you.com/
You.com от YouChat - размышляющий ассистент, примечателен возможностью проведения исследований (три в день), есть приложения для мобилок.
https://poe.com/
Poe от компании Quora - автоматизация ботами, есть приложения для мобилок.
https://openrouter.ai/chat
OpenRouter (США) - популярный сервис, доступ к десятку популярных моделей, есть какие-то интерфейсные плюшки.
Также посмотрел и не нашел пользы:
https://www.genspark.ai/
Genspark - агенты, создание картинок и видео, плюс другие инструменты, может даже звонить по телефону, но бесплатного тарифа хватило всего на два запроса.
https://llm.hunyuan.tencent.com/#/chat/hy-t1
Довольно умная рассуждающая модель T1 от Hunyuan, входящего в Tencent (CN), но интерфейс оставляет желать лучшего.
Tencent является технологическим гигантом, но сегодня больше ориентирован на корпоративных клиентов и внутренний рынок, чем на массового пользователя.
NB: Еще один китайский гигант ByteDance (владелец TikTok) вовсе не имеет публичного веб-интерфейса для своих LLM, таких как Doubao. Их модели доступны через API или интегрированы в продукты ByteDance (например, Douyin), но прямого браузерного чата нет.
https://bigscience.huggingface.co/
Мультимодальная BLOOM от международного сообщества BigScience - значительный проект, но не имеет своего собственного веб-сайта.
https://playground.sea-lion.ai/
SEA-LION от AI Singapore - небольшие модели, максимальный вес 70B.
https://sea-sailor.github.io/
Sailor от SEA AI Lab и Singapore University of Technology and Design - скромные нейронки весом около 20B, тестировать предлагают на хаггинг-фейсе.
https://chat.falconllm.tii.ae/
Falcon LLM от Technology Innovation Institute (ОАЭ), предоставляют только слабые модели весом до 10B.
https://nova.amazon.com/
Американский гигант Амазон тоже разрабатывает разные нейронки в семействе Nova, но доступ через веб-интерфейс только из США.
https://www.grokker.com/grokkyai
Израильский Grokker, вроде как предоставлял бесплатный доступ к локальной модели, оптимизированной для аналитики и чата, но теперь нужно вставать в очередь при запросе демо.
https://cohere.com/
Канадский Cohere с доступом к одноименной модели - какие-то проблемы с логином, возможно криво организованная блокировка для ряда стран.
https://www.01.ai/
Китайский 01.AI (от бывшего сотрудником Google) с доступом к семейству моделей Yi - не нашел веб-интерфейса для тестирования, есть только предложение попробовать корпоративное решение с ДипСиком.
https://inceptionai.ai/jais/index.html
Jais AI от Inception (ОАЭ) - не проверял из-за нежелания заполнять регистрационную анкету.
https://ying.baichuan-ai.com/chat
Китайский Baichuan - на сайте среди иероглифов не видно возможности регистрации, похоже необходим китайский мобильник.
https://damo.alibaba.com/
SeaLLM от Alibaba DAMO Academy - для регистрации и входа нужен китайский мобильник.
Пожалуй, на этом уже можно затормозить.
Итого, выше упомянуты большая пятерка, русская двойка, четыре годных китайца (и десяток посредственных), не считая агрегаторов и локально запускаемых моделей - мир широк, и становится всё шире.