ИИтоги 2024: общий тренд, видео и цензура.
Подвел небольшие итоги того, что произошло в AI индустрии за этот год. Какие тренды, какие изменения, что было нового и клевого, а что было не очень радостным. Будет много ссылок внутри — не ленитесь, переходите, читайте и изучайте подробнее!
1. Общий тренд.
После прогресса в сфере генеративных text to image нейронок мы ставили на переход в видео и 3D, на деле же наибольший прогресс случился в обычном text to text. То, что казалось волшебством в ChatGPT теперь меркнет по сравнению с тем что может GPT4o или Claude. Это отразилось и на графичческих нейронках – Dalle-3 начал составлять серьезную конкуренцию Midjourney и Stable Diffusion именно за счет связки с языковой моделью GPT, которая помогала ему лучше понимать промт пользователя и точнее ему следовать при генерации изображений.
2. Видео.
К концу года мы наконец увидели релиз SORA от openAI. Однако, спустя год после их анонсирующей презентации то, что казалось нам чем-то невероятным, теперь уже не так впечатляет. На протяжении всего года за место под солнцем бились множество других игроков, которые во всю разрабатывали свои конкурентные продукты с видео-генерацией, демонстрируя не менее достойный уровень. Особенно радует, что самые успешные сервисы по AI video предоставляют на данный момент Китайские разработчики (Kling и Hailuo). Мы как пользователи только радуемся здоровой конкуренции, тем более что использовать видео-нейросети в продакшене теперь действительно можно, хоть и всё еще не везде.
3. Выход на рынки.
Этот год научил меня не радоваться появлению крутых бесплатных инструментов ровно так же как не привыкать к персонажам "Игры Престолов". Если в начале года многие крутые сервисы были практически полностью бесплатными то уже к середине года большинство из них работают исключительно по подписке, предоставляя с барского плеча пару пробных генераций в неделю. При этом еще не всегда сохраняя прежнее хорошее качество. Раньше я ненавидел рекламу по телевизору, в интернете и на YouTube, а сейчас уже сильно скучаю по тем временам когда всё было бесплатным, а компании получали свою прибыль за счет встроенной рекламы. А вы че думаете?
4. Цензура и регуляция.
Пока с одной стороны у нас open source модели генерят то, что потом невозможно развидеть, с другой стороны крупные игроки в лице OpenAI и Google душат любой креатив своими рамками защиты от копирайта и NSFW контента. Такие рамки конечно хороши, но пока что они идут лишь во вред — генеративка от гугла проваливается из-за того что в каждом запросе видит что-то непотребное, Dalle-3 сильно проигрывает Midjourney из-за невозможности генерить в стиле различных художников, а та самая SORA кажись еще долго будет регулировать свои защитные механизмы прежде чем в ней без труда можно будет сгенерить хоть что-то осмысленное. Хотя тут конечно большое пространство для дискуссий, можем и подраться!
5. Выход в интерфейсы.
Уже не помню когда последний раз слышал про ужасно неудобный интерфейс для Stable Diffusion — Automatic1111. Все любители SD пересели на более удобный Forge и другие его аналоги, PikaAI и Luma перешли из дискорда на свои Web интерфейсы, и даже !!!Midjourney!!! наконец-то запустили полноценный сайт для генераций в вебе а не через Дискорд.
Что будет дальше?
Мои прогнозы в AI не сбываются так что я воздержусь фантазировать, но расскажу чего лично мне хотелось бы ожидать в 2025-м. Моя главная боль — когда приходят с вопросом "подскажи нейросеть которая может сделать..." и тут приходится открывать свой список 100+ нейронок разной степени паршивости. Хочется чтобы в 2025 году всё более менее улеглось, слабые игроки отсеялись а сильные заняли рынок, и этот список 100+ сократился до 3-х или 5-ти базовых и проверенных сервисов. Сам же хочу постараться углубиться в более хардовые инструменты, вернуться к SD и освоить ComfyUI, потому что он всё ещё крут и на его основе люди продолжают делать впечатляющие вещи. Буду очень ждать расширения функционала Midjourney и надеяться что они не повысят при этом прайсы до уровня цен OpenAI.
Если вам интересны мои размышления и дайджесты: подписывайтесь, читайте, обсуждайте: t.me/alexandsheeps